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Préface 


C’est avec beaucoup d'intérêt que j'ai pris connaïssance du projet de 
Dany-Jack Mercier d'éditer une revue originale destinée à publier des tra- 
vaux, consacrés aux mathématiques et à leur enseignement d’un type dont on 


doit bien admettre qu’il a du mal à trouver sa place dans les revues existantes. 


Fruits de l’expérience de leurs auteurs, comme enseignants dans le secon- 
daire, dans le supérieur, et notamment en préparation aux concours de recru- 
tement d'enseignants, également comme chercheurs, ces articles possèdent un 
caractère hybride, métissé, qui les fait échapper aux canons classiques de l’ar- 
ticle de didactique, historique, épistémologique, mathématique ou du manuel 
de cours. 


Et pourtant, c’est bien la lecture de ce type de contributions, érudites 
sans être académiques, rigoureuses sans être pesantes, pleines de remarques, de 
conseils ou de compléments en marge du propos principal, qui aide à fonder une 
culture mathématique riche et cohérente, à l'opposé de la succession d'éléments 
épars et sans lien qui marque trop souvent les cursus actuels. 


Connaissant l’exigence de rigueur mathématique de Dany-Jack Mercier, 
rigueur qui traverse son oeuvre didactique, scientifique au travers de projets 
aussi divers que réussis - comme son site Mégamaths, ses ouvrages pédago- 
giques - je peux affirmer que le lecteur pourra parcourir les articles en toute 
confiance et qu’il y fera une multitude de découvertes enrichissantes. 


Dans une période où l’immédiat, le clinquant, la superficialité semblent 
l'emporter, il est rassurant de voir quelqu'un se lancer seul, dans une entre- 
prise aussi noble qu’utile à la collectivité. Longue vie aux "Lectures sur les 
Mathématiques, l'Enseignement & les Concours" ! 


Antoine Delcroix 
Professeur à l'IUFM de Guadeloupe 
Responsable du CRREF 


Président du Conseil Scientifique et Pédagogique 
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Avant-propos 


Voici le premier numéro d’une revue dédiée aux mathématiques, à l’en- 
seignement et aux Concours. 


Vaste programme s’il en est, cet espace de liberté est ouvert à tous les 
collègues de la maternelle à l’université qui désirent partager leurs travaux 
pour donner à ceux-ci une visibilité supplémentaire et les proposer aux lecteurs 
avertis. Les thèmes abordés dans cette revue se veulent libres et variés. 


En me lançant dans ce projet de publication, ma première idée était de 
donner la parole aux praticiens des mathématiques, à tous mes collègues qui 
vivent leur science au jour le jour devant des élèves, en leur proposant un 
espace où ils pourraient s'exprimer en direction de tous ceux qui désirent lire 
de beaux textes mathématiques, qui veulent réfléchir sur les divers aspects de 
notre métier d'enseignant, ou qui préparent des concours et cherchent aides 
et munitions sous la forme d’exposés ciblés et suffisamment détaillés sur des 
thèmes fondamentaux. 


Mon expérience de webmestre de MégaMaths m’a montré qu’un bon 
nombre de "perles", de travaux intéressants faits par des collègues, ne sont 
pas diffusés largement ou, s’ils le sont sur internet, font rarement l’objet d’une 
publication officielle. C’est dommage, car même si la mise en ligne sur internet 
est un outil remarquable et simple de mise à disposition de l'information, la 
publication traditionnelle, avec ses besoins de présentation minutieuse et de 
relectures répétées, demeure le moment où la publication "prend date" et se 
trouve définitivement prise en compte par la communauté. 

Aller jusqu’à la publication physique d’un livre, c’est aussi proposer aux lec- 
teurs un outil de travail bien réel qu’il pourra avoir plus envie d'utiliser. 


Cet espace est un espace de liberté où nous nous retrouvons entre "afi- 
cionados" : auteurs et lecteurs. Ici seul le contenu et les idées importent, sans 
qu’il soit nécessaire de suivre une ligne imposée ou de se plier à une quelconque 
mode forcément passagère. 


Ce premier numéro propose 7 articles. Le premier est un article de didac- 
tique qui montre le travail d’un professeur dans sa classe de sixième, et les six 
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autres sont des articles de fond qui intéresseront en particulier les candidats 
aux concours qui désirent réviser un thème et s'entraîner sur des exercices 
corrigés. 


Voyons cela plus en détail : 


» Dans "L'apprentissage de l’autonomie en sixième", Laurence Chéla- 

mie nous montre, exemples à l’appui, comment un professeur de collège peut 
espérer rendre ses élèves plus autonomes et directifs devant un problème ma- 
thématique. L'objectif est bien de motiver un authentique "passage à l’acte" 
pour qu’un élève de sixième ne se sente plus démuni devant un texte mathé- 
matique qui lui est proposé. 
Comment lui donner des schémas de réaction ? Quels objectifs doit-on choisir ? 
Quelles activités peut-on imaginer dans sa classe pour atteindre ces objectifs ? 
Autant de questions qui méritent d’être posées et qui le seront, de façon tou- 
jours très sensible, dans cet article. 


> Ensuite nous laisserons notre collègue et pédagogue Dominique Hoareau 
nous raconter des "Histoires de groupes". Son article de synthèse permet de 
survoler en quelques pages une bonne partie de tout ce que l’on doit connaître 
sur les groupes quand on prépare un concours de recrutement. 
Les structures algébriques ont été une des conquêtes du vingtième siècle, et 
les groupes tiennent une place de choix dans ces structures. L’exposé est bien 
mené et motivant ! 


» Je vous propose ensuite de plonger dans un espace projectif pour aller 
voir comment démontrer d’un seul coup deux jolis et très classiques théorèmes 
d’alignement, les théorèmes de Pappus et de Desargues, qui n’ont rien perdu 
de leur fraîcheur malgré les siècles! 

Démontrer ces résultats sans devoir nous placer dans chacun des six cas de 
figures possibles est une bénédiction. 

Mais pour ce faire, il est nécessaire de bien introduire les espaces projectifs et 
de montrer en quoi ils peuvent nous intéresser en géométrie classique. J’ai donc 
insisté sur la description du lien entre espaces projectifs et espaces affines, et 
sur toute la mécanique du travail "en coordonnées projectives' une fois que 
Von à choisi un repère projectif. 

Aucune connaissance préalable des espaces projectifs n’est demandée. Il suffit 
de connaître un peu d’algèbre linéaire pour pouvoir lire cet article. La fin de 
l’exposé profite de l'investissement que nous avons consenti pour parler : 


- des théorèmes duaux (qui se déduisent mécaniquement d’autres théorèmes 
en échangeant les rôles des points et des droites), 


- des homographies et du lien avec les fonctions homographiques de R 
dans R. 
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» Le quatrième voyage se passe au pays des solides pathologiques et donc 
de la célèbre formule d’'Euler $ — À + F = 2 conjecturée en 1750 et démontrée 
rigoureusement en 1794 par Legendre. La preuve de cette formule sera donnée 
en utilisant des graphes connexes. 


» L'article de Robert Rolland est un article de fond sur l’analyse, ses 
outils de base et leurs utilisations dans le cadre du calcul infinitésimal. 
L'auteur sait magnifiquement nous intéresser tout au long de cette pérégri- 
nation : accroissements finis, points fixes, méthode de Newton, intégration, 
interpolation... Le panorama qui se dégage nous permet de mieux prendre 
conscience des enjeux et des objectifs de cette partie des mathématiques. 


> Jean-Etienne Rombaldi nous propose ensuite une étude sur "l’accélé- 
ration de la convergence des suites réelles". 
Toutes les définitions sont clairement précisées (convergence lente, géométrique 
de rapport À, rapide, super-linéaire) et commentées. Pas moins de 19 exercices 
sont livrés avec une correction complète et serviront d’entraînement pour les 
candidats aux concours. 
L'article, qui s'achève sur la description des procédés d’accélération d’Aïtken 
et de Richardson, a le mérite de proposer un exposé cohérent et précis sur un 
sujet qui n’est pas souvent traité dans la littérature bien que présent dans le 
programme de loral du CAPES (session de 2008) et donc aussi dans celui de 
l'agrégation. 


m Et nous arrivons à la dernière étude proposée par Arnaud de Saint 
Julien. Notre collègue, enseignant en CPGE, se propose de déterminer toutes 
les matrices carrées "toutes puissantes" sur un corps K lorsque K est C, R, Q 
ou un corps fini F,, c’est-à-dire toutes les matrices carrées À telles que, pour 
tout n € N*, il existe une matrice B vérifiant À = B7. 

Cette étude spécialement bien menée est l’occasion de reparler de la réduction 
des endomorphismes et d'utiliser la décomposition de Dunford. 

Beaucoup de jolis résultats sont mis en valeur et utilisés, comme ce raffinement 
de la surjectivité de l’exponentielle complexe qui s’énonce : 


"Pour toute matrice M de GL,(C), il existe un polynôme P de C [X] 
tel que M = exp(P(M))" 


dont on propose deux preuves totalement différentes, l’une en utilisant la dé- 
composition de Dunford et le Théorème de Cayley-Hamilton (Lemme 7.2) et 
l’autre, très élégante, qui utilise des arguments topologiques (exercice 7.3). 
Cerise sur le gâteau, la dernière section propose quatre exercices originaux et 
bien jolis qui mettent en oeuvre des résultats importants. 


Voilà qui clôt ce petit tour d’horizon du volume I. 
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Je voudrais terminer en remerciant chaleureusement tous les contributeurs 
de ce numéro, et je dois dire que, malgré le temps et la sueur que cela m’a 
coûté, j'ai pris suffisamment de plaisir à lire ces articles tout en les formatant 
pour qu’ils entrent dans ce recueil aux normes imposées... pour recommencer 
l’aventure prochainement pour un second volume. 


Je voudrais aussi signaler que j’ai entrepris ce travail dans le cadre du 
CRREF (Centre de Recherche et Ressources en Education et Formation de 
PIUFM de Guadeloupe) auquel je fais partie. 


Je lance enfin un appel aux collègues qui voudraient me proposer un article 
en leur demandant de prendre simplement contact avec moi par mail!. Bien 
entendu vous pouvez aussi me contacter pour me faire part de vos remarques 
au sujet du volume que vous avez entre les mains. Vous pouvez aussi aller 
sur le site Web MégaMaths pour me retrouver, partager vos commentaires, 
télécharger des documents numériques ou découvrir l’espace qui sera dédié à 
cette revue. 


Maintenant il est temps de nous plonger dans ces articles passionnants… 
et citer Charles Baudelaire : 


Plonger au fond du gouffre, 
Enfer ou ciel, qu'importe ? 
Au fond de l’inconnu 

Pour trouver du nouveau ! 


Bonne lecture ! 
Poiïnte-à-Pitre ce 26 janvier 2009 
Dany-Jack Mercier 


AVERTISSEMENT : 
Ce livre a fait l’objet d’une première parution aux éd. Publibook en 2009 
Photo de couverture extraite du catalogue de Gwenn Seemel : 
Bohemian waxwing, sur Flickr 


ldany-jack.mercier@hotmail.fr 


Chapitre 1 


L'apprentissage de 
l’autonomie en sixième 


L’apprentissage de l’autonomie devant un énoncé 


mathématique en classe de sixième. 


(Laurence Chélamie |) 


Résumé : En entrant en sixième, l’enfant découvre un nouveau 
contrat avec les professeurs, doit acquérir de nouvelles habitudes et 
conquérir plus d'autonomie. Mais comment permettre aux élèves 
d’être plus autonomes et directifs devant un problème mathéma- 
tique ? Quelles activités peut-on construire pour faciliter ce « pas- 
sage à l’acte » nécessaire chez nos élèves ? Que répondre quand 
ceux-ci se contentent de clamer : « Madame, je ne comprends 
pas! »? Cet article, tiré d’un mémoire professionel présenté en 
juin 2003 à l'IUFM de Guadeloupe, nous offre des pistes de ré- 
flexion sur l’enseignement des mathématiques en classe de sixième, 
tout en décrivant et analysant des expériences pédagogiques réelles 


vécues dans une classe?. 


Professeur certifiée au Collège de Port-Louis (Guadeloupe), chelamie.emma@wanadoo.fr. 

?Je voudrais remercier mon tuteur, M. Dany-Jack Mercier, pour sa disponibilité, son aide 
et ses conseils. Je tiens également à remercier M. Rony Versin, professeur des écoles, qui m’a 
guidé dans l’élaboration de ce mémoire. Enfin, j’adresse un vif remerciement à tous les élèves 
de la classe de sixième du Collège Edmond Bambuck du Gosier (en Guadeloupe) sans qui ce 
travail n'aurait jamais pu exister. 
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16 CHAPITRE 1. L'APPRENTISSAGE DE L'AUTONOMIE EN SIXIÈME 


1.1 Introduction 


Au collège, les mathématiques contribuent, avec d’autres disciplines, à en- 
traîner l’élève à la pratique d’une démarche scientifique. L'objectif est alors 
de développer conjointement et progressivement les capacités d’expérimenta- 
tion et de raisonnement (observation, analyse, pensée déductive), de stimuler 
l'imagination et l'intuition, d’habituer l’élève à s'exprimer clairement, aussi 
bien à l’écrit qu’à l’oral, et de développer son analyse critique. 


Pour se faire, on vise la maîtrise des techniques mathématiques élémentaires 
de traitement d’informations (organisation des données, représentations, mo- 
délisations, mises en équation...) et de résolution (calculs, équations, construc- 
tions). 


Leur emploi, dans la prévision et l’aide à la décision, est précieux dans de 
multiples circonstances, allant de la gestion familiale à l’activité profession- 
nelle, et de cette manière les mathématiques contribuent à la formation du 
futur citoyen, ce qui constitue l’une des missions affichée du collège. 


Dans le domaine spécifique de l’enseignement des mathématiques, un certain 
nombre de conditions sont mises en œuvre pour amener l'élève à développer 
ses capacités de travail personnel, ainsi que son aptitude à chercher, à com- 
muniquer et à justifier ses affirmations. 


À ce niveau, sur le terrain, on prend vite conscience des difficultés inhérentes 
à l’imcompréhension d’un énoncé mathématique : cela apparaît en sixième dès 
les premiers apprentissages, et suscite le plus souvent chez l’élève une perte de 
confiance en soi ainsi que le désir d’abandonner tout effort pour trouver une 
réponse au problème posé. 

Dans cet article, je propose quelques éléments de réflexion concernant l’ap- 
prentissage de l’autonomie d’un élève de sixième face à un énoncé mathé- 
matique. C’est l’observation d'élèves de sixième qui m'a incité à réfléchir sur 
cette « nécessaire » quête de l’autonomie, et à rechercher des situations d’ac- 
compagnement qui, autant que possible, prennent en compte l’aspect cognitif, 
sans pour autant négliger les dimensions affectives et relationnelles de la si- 
tuation d'apprentissage. Le but de cet accompagnement est d'amener l’élève 
à se rendre autonome par rapport à un énoncé, c’est-à-dire agir efficacement 
seul, prendre des initiatives, et cela suppose qu’il ait intériorisé des éléments 
d'observation, de recherche et de remédiation. 


Devant un exercice mathématique, un élève de sixième adopte deux attitudes 
différentes. On remarque d’un côté des élèves qui cherchent, écrivent et parfois 
trouvent la solution et, de l’autre, des élèves qui n’écrivent rien, semblent relire 
l’énoncé à plusieurs reprises, et finissent parfois par interpeller leur professeur 
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en prétextant « ne pas comprendre » ce qui est demandé, voire « ne pas 


2 2 


comprendre un seul mot de l’énoncé ». 


Voici une anecdote permettant d'illustrer ces propos. Lors d’une séance de 
travaux dirigés en géométrie, l’exercice proposé était le suivant : 


Soit un segment [AB] de longueur 6 cm. 
Placer le point O milieu de [AB]. 


Pendant la phase de recherche individuelle et après entretien dans la classe, 
j'ai pu constater qu'aucun des élèves ne comprenait la signification du mot 
« soit ». Pourtant, deux attitudes émergèrent. D'un côté, des élèves, disons 
le groupe À, qui restèrent focalisés sur le mot « soit », et pour qui il était 
impossible de poursuivre l'exercice à cause de ce mot. D’un autre côté, le reste 
de la classe, disons le groupe B, qui occulta le mot « soit », et décida, de façon 
très logique, que, pour placer le point ©, il fallait bien au préalable avoir été 
capable de tracer le segment [AB]. 


Avec le groupe À, il fallut expliquer que le mot « soit » voulait simple- 
ment dire que l’on considérait un segment [AB], reformulation a priori plus 
complexe, mais qui paru beaucoup plus claire et permit de débuter la construc- 
tion. Contrairement aux élèves du groupe À, ceux du groupe B avaient réussi 
à prendre du recul vis à vis de l’énoncé et ainsi, à faire preuve d’une certaine 
autonomie face à ce dernier. 


Ainsi donc, une simple reformulation de la part du professeur pouvait per- 
mettre de débuter la résolution d’un exercice. Cette reformulation orale des 
énoncés, dès lors que ces derniers étaient incompris par les élèves, étaient certes 
une réponse possible, mais risquait à la longue de leur porter préjudice, dans le 
sens où elle ne développait pas leur autonomie mais au contraire les encoura- 
geait à rester dépendants de leur enseignant. À long terme, une telle attitude 
de dépendance vis à vis du professeur risquait d'empêcher l’élève d'acquérir 
et de maîtriser le vocabulaire spécifique des mathématiques, d'empêcher une 
prise d'initiative, alors même qu'il serait inévitablement amené à réagir seul 
face à un énoncé lors des devoirs à la maison ou pendant les contrôles. 

Toutes ces raisons m'ont incitée à me poser la question de l’autonomie des 
élèves devant un énoncé mathématique : comment pourrait-on faire pour en- 
courager la prise d'initiative et le choix d’une attitude autonome, en particulier 
chez l’élève rencontrant des difficultés en mathématiques ? 


Mais que désigne-t-on par l’autonomie d’un élève par rapport à un énoncé 
mathématique ? 


« Dans le domaine des apprentissages, l'autonomie se caractérise 
par la faculté de prendre en charge ses apprentissages..., et de 
mener à bien la tâche demandée » [2]. 
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Certains apprenants ont du mal à mener à bien cette tâche. Dans une classe, 
les élèves qui ne sont pas autonomes sont vite repérés : ils ont toujours besoin 
du professeur à leurs côtés, afin que celui-ci seconde chacun de leurs gestes. 
Ce trait de caractère est relativement fréquent chez l’élève de sixième. 


Essayer de rendre l’élève autonome face à un énoncé mathématique, c’est 
essayer de l’amener à réagir efficacement seul face à ce dernier. Bien entendu, 
pour qu’il puisse y parvenir, cela sous-entend qu'il ait déjà assimilé quelques 
éléments de remédiation « que le professeur aura mis en lumière avec lui ». 

Conservons en mémoire qu’un des objectifs importants de l’enseignement 
des mathématiques est d'amener l’élève à pouvoir résoudre des problèmes. 
Cette résolution passe par différentes phases qui nécessitent à chaque fois des 
apprentissages spécifiques. Il s’agit en général de : 


comprendre l’énoncé et construire une représentation, 


mathématiser l'énoncé et le mettre en signes, 


mettre en œuvre des stratégies et des procédures de résolution, 


répondre à la question posée et vérifier si cela correspond au « bon 
sens » ou à l'intuition. 


La compréhension de l’énoncé est la première étape à franchir dans le pro- 
cessus de résolution, et c’est souvent à ce niveau que surgissent les premières 
difficultés. C’est le premier facteur important qu’il faut prendre en compte 
pour que l’élève devienne un jour autonome face à un énoncé mathématique. 
Dans cet article, je me limiterai volontairement à ce premier facteur, c’est- 
à-dire essentiellement à la compréhension de l’énoncé, et en particulier aux 
problèmes respectifs de la lecture et du décodage de celui-ci. 


Ces précisions étant données, il convient dans un premier temps de définir 
ce que l’on entend par « énoncé » et « consigne », puis d’essayer de mettre 
en lumière les raisons de l’attitude passive de certains élèves face à un énoncé, 
pour finalement expérimenter quelques solutions. 


1.2 Quelques définitions... 


Mais, que signifie un énoncé en mathématique ? Une consigne ? 


1.2.1 La consigne 
Dans le Petit Larousse, la consigne se définit comme « une instruction for- 
melle donnée à quelqu'un chargé de l’exécuter ». 


Selon Jean-Michel Zakhartchouk, par « consigne », on entend « toute in- 
jonction donnée à des élèves à l’école pour effectuer une tâche de lecture, 
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d'écriture, de recherche, etc. La consigne s’appuie souvent sur un énoncé ex- 
plicite, mais les données nécessaires pour l’effectuer sont parfois implicites, 
d’où la nécessité d’un décodage (...) » ([11] p. 18). 


1.2.2 L’énoncé mathématique 


La notion de « problème mathématique », prise au sens large, comprend 
des exercices, des activités et des problèmes enchaînés. L’énoncé écrit d’un 
problème mathématique est un texte injonctif, qui se constitue, le plus souvent, 
de deux parties : 


- La partie informative, où l’on donne les informations nécessaires à la 
réalisation de la tâche. La présentation de ces informations peut se faire sous 
différentes formes : texte, tableaux, graphiques, dessins, schémas, etc. 


- La partie directive, où sont écrites la ou les consignes qui explicitent la 
tâche à effectuer. 


1.2.3 Propriétés de l’énoncé 


La consigne, incluse dans l’énoncé mathématique, peut se présenter sous la 
forme d’une injonction ou d’une question. 


Lorsque la consigne est un ordre, la tâche attendue de la part de l’élève est 
explicite (cf. Exemple 1) et des verbes d’action sont utilisés à l’impératif ou à 
Pinfinitif tels calculer, décrire, tracer... 


Lorsque la consigne est une question, l’interrogation peut se présenter sous 
trois formes différentes : totale, partielle ou indirecte. Dans les trois cas, la 
tâche attendue de la part de l’élève est alors implicite. En effet, bien que non 
précisée, une justification est attendue (cf. Exemple 2). 


F1G. 1.1 — Figure codée. 
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Exemple 1 ([7}, p. 250) : 

> Information : On donne la figure 1.1 qui est codée. 

»m Consignes : Donner la mesure de l’angle BAD et la longueur BD. Expli- 
quer. 


Il est intéressant de noter que les énoncés d’exercices de géométrie en sixième, 
sont plus directifs que ceux d’algèbre ou de gestion de données. En général, ils 
ne sont composés que de consignes. 


Exemple 2 ([4], p. 49) : 


> Informations : Dans une salle de cinéma, il y a 127 places. Seules trois 
rangées de 31 sièges sont occupées. 


»m Consigne : Combien y a-t-il de places libres ? 


1.3 Difficultés rencontrées par les élèves 


1.3.1 « Madame, je ne comprends pas! » 


Pour trouver les raisons de l’attitude passive de certains élèves face à un 
énoncé, je me suis focalisée sur cette phrase qui ressort dès qu’on les interroge : 


« Madame, je ne comprends pas! ». 


Que peut-il se cacher derrière cette phrase ? 


Après quelques questions, je me suis rendue compte que le champ lexical 
d’un élève de niveau moyen était limité. Cette même phrase avait une signifi- 
cation différente pour chacun des élèves. Les sous-entendus les plus récurrents 
de cette phrase sont les suivants : 


» Manque de motivation, découragement et absence de volonté à vouloir 
s'impliquer dans le travail de recherche demandé. Aïnsi, interpeller le profes- 
seur par l'intermédiaire de cette phrase, se trouve être, pour eux, la garantie 
d’une aide. 


» Incompréhension de l’énoncé ou de la consigne, provenant soit d’une lec- 
ture précipitée, soit d’un mal plus profond (ignorance du vocabulaire spécifique 
et vocabulaire courant, ignorance des constructions et usages syntaxiques, ana- 
lyse erronée de la phrase... ). 


» Définitions non sues, et par conséquent impossible à appliquer. 


> Incapacité d'organiser les étapes de résolution, on ne sait pas comment 
s’y prendre. 
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> Incapacité de savoir les notions mathématiques mises en jeu et quels outils 
mathématiques utiliser. 


La motivation est un paramètre important dans le processus d’apprentissage 
de l’élève et pourrait, à lui seul, faire l’objet d’un mémoire. Dans la suite, nous 
nous intéresserons seulement aux cas des élèves qui, bien qu’un tant soit peu 
motivés, restent incapables d'entamer une procédure de résolution. 


Afin de mieux cerner les difficultés des élèves, ainsi que leurs méthodes de 
travail, un questionnaire leur à été distribué (cf. Annexe L.a et 1.b). 


Sur 14 élèves ayant répondu au questionnaire, 9 justifient leur incapacité à 
débuter un exercice et leur attitude passive, par le fait qu’ils ne comprennent 
pas la consigne. Selon eux, la solution pour pallier cette difficulté est de re- 
lire la consigne jusqu’à ce qu’ils la comprennent. Le cours non appris (43 % 
des élèves), le manque de temps pour réfléchir (36 %), le découragement et 
l’énervement (14 %) sont également évoqués. 


Concernant la proposition « à partir d’un énoncé de problèmes et de mes 
connaissances, je sais comment trouver des pistes de solutions », 8 élèves 
répondent affirmativement, 3 négativement et 3 répondent parfois. 


À partir de ce questionnaire, il semble que ces élèves soient capables d’ima- 
giner les causes de leurs difficultés. Malheureusement, leur technique de travail 
est relativement floue. Mis à part relire l’énoncé lorsqu'ils n’arrivent pas à dé- 
buter, il semblerait qu’ils n’aient pas d’autres outils à leur disposition. Ceci 
corrobore l’idée de Jean-Michel Zakhartchouk suivant laquelle : « Le jeune 
élève de sixième, bien souvent ne sait pas travailler... » ([11], p. 3). 


Quelques difficultés rencontrées par les élèves de sixième face à un énoncé 
mathématique, semblent devoir être davantage approfondies, afin de pouvoir 
en apprécier les causes et tenter de trouver des solutions. 


1.3.2 Le découragement et la peur d’être jugé 


Accepter de résoudre un problème mathématique, c’est accepter de prendre 
un risque, de se tromper et d’être jugé. 

La crainte du jugement peut être un frein dans la prise d'initiatives. Je 
peux citer comme exemple, le cas d’un élève de ma classe : son caractère est 
vraiment particulier. Il ne supporte aucune critique et ne s’implique dans les 
activités que lorsqu'il se sent en confiance. Dans le cas contraire, il ne fournit 
aucun travail ou vous interpelle en disant qu’il n’a rien compris. 
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Identifier le type d'erreurs commises lors du devoir en classe : 


CINITIT 
CHI 


1. Quand vous ne réussissez pas un exercice, quelles sont à votre avis les raisons de 
votre échec ? 


Loi\ je n'ai appris mes Regons où je n'ai pas NRC 
da cœmsignegtesens de Lerercice, me 


2. Lors d’un exercice, vous arrive t-il de ne pas comprendre ce que l’on vous 


demande ? Si oui , dîtes les raisons qui font que vous ne comprenez ce qui est 
d mandé. Rs ELLE ES 


Oui , souvent c ‘est que N ne replecRis y°S assel otre (2 
pas Bien La consigne où Caqueshon poseë : 


3. Que faîtes vous lorsque vous ne comprenez pas un exercice , ou que vous 
n'arrivez pas à démarrer? 


————————————…—…"—"—"—"—_—_— 
de veRis Qénonce où La consigne gasqu'a que 4e Camp, 


Annexe 1.a 
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Coche ci-dessous les réflexions qui traduisent ce que tu ressens 


Je trouve que les mathe, c'est difficie 


X 


ans 
Je comprends la Correction et je suis capabis de la refaire enauin 

pores 
Co 


CE 


as 
Je sais reconnaitre les ercices du mére genre que ceux qu'on à déjà fait. 

Quand j'ai reconnu un exercice du même type qu'un Géfà fait, je sais reproduire la solution. 
Les devoirs à is maison sont trop nombreux 

Je sais ce Qu'i faut aporendre en maths 
eo 
Même si ma façon de travailler n'est pes efficace, je n'ai pes envie d'en changer 
RS EE 
peamans 


Annexe 1.b 


XX 


XL XL MDN 


D< 
é 


qe 
X 


Le découragement est également un frein à cette prise d'initiatives. Certains 
élèves partent vaincus dès le départ en prétextant que de toutes les façons, ils 
sont nuls en mathématiques et donc ne peuvent pas comprendre. C’est face à 


ce type d’attitude que l’on se rend compte que démystifier l’énoncé n’est pas 
chose inutile. 


1.3.3 Les difficultés liées à la langue française 


Certains élèves de l’école primaire arrivent en sixième avec une maîtrise 
imparfaite de la langue française. Par conséquent, ces derniers rencontrent des 
obstacles au niveau de la lecture et de la compréhension d’un texte, de la 
gestion des données, de l’argumentation, etc. De plus, « l'apprentissage de la 
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lecture n’est pas achevé à l’entrée en sixième » ([8], p. 88). L'élève de sixième 
n’est donc pas capable de lire n’importe quel texte. 


La maîtrise imparfaite de la langue, influe sur la compréhension des mathé- 
matiques. Les domaines concernés sont le vocabulaire limité, les conjonctions 
de coordination (alors, puis, et, donc, .…), la syntaxe. 


1.3.4 Le vocabulaire 


L'une des caractéristiques du langage mathématique est l’usage de mots de 
la vie courante dans un sens spécifique et ceci, n’est pas sans conséquences. Le 
sens de certains mots peut être différent selon la discipline dans laquelle il est 
employé. 


Considérons par exemple, le verbe « comparer ». En mathématiques, com- 
parer des nombres signifie dire lequel est le plus petit ou le plus grand, ou 
encore s'ils sont égaux. En français, il signifie « étudier les ressemblances et 
les différences entre deux êtres ou deux choses ». 


Les différents emplois des mots de la vie courante dans l’enseignement des 
mathématiques, sont souvent chez eux, source de confusion. Citons comme 
exemple, les mots « milieu » et « centre ». Dans la vie courante, le mot milieu 
est employé dans l'expression «être au milieu de ... » et en mathématiques, 
on parle du milieu d’un segment. Dans le premier cas, « milieu » renvoie 
à « être au centre de », ou « être parmi... », alors que dans le deuxième 
cas, il signifie « un point appartenant au segment et équidistant des deux 
extrémités ». 


J’ai encore en mémoire, une anecdote qui s’est déroulée dans la classe de 
sixième d’un confrère et qui illustre bien la situation. Les élèves devaient réa- 
liser une construction géométrique. La consigne était la suivante : Montrer 
que I est le milieu de [AB]. Un élève l’interpella et lui dit « Tenez monsieur, 
je vous montre ». Et, il montra du doigt sa figure où, effectivement, le point 1 
était le milieu du segment [AB]. 


En ayant le souci d’aider à la compréhension de l’énoncé chez l'élève et 
sachant que « la maîtrise de la langue est un objectif majeur de l’enseignement 
au collège » ([3], p. 23), il apparaît que définir les mots que nous utilisons en 
mathématiques est une étape importante, ainsi que donner des exercices où ils 
doivent employer le mot correct pour décrire une situation (cf. Expérience 2 
p. 31). 

Nous devons garder en mémoire que la maîtrise de la langue (lecture, écri- 
ture et expression orale) est une priorité de l’enseignement au collège et qu’elle 
« ...ne peut être pleinement assurée que par la contribution de chaque disci- 
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pline »Ÿ. La maîtrise du langage à travers l’enseignement des mathématiques, 
va contribuer à la maîtrise de la langue française. 


1.3.5 Les conjonctions de coordination 


En interrogeant mes élèves sur leurs cours ou en travaillant avec eux sur des 
activités, j’ai pu me rendre compte que l’emploi des conjonctions de coordina- 
tion telles que « si, alors, donc », n’était pas correctement perçu. Très utilisées 
lors de la rédaction de certaines propriétés mathématiques, elles constituent un 
obstacle certain à la compréhension de ces propriétés par l’élève. La même dif- 
ficulté surgit évidemment en géométrie, particulièrement dans les programmes 
de construction (« construire un triangle ABC tel que ..., puis tracer ... »). 
Leur emploi dans ces programmes de construction, empêche certains élèves 
de percevoir l’ordre dans lequel il faut effectuer les étapes. Selon Pierre Le- 
grand [8], cette situation s’explique par le fait que l'élève, entrant en sixième, 
manque d’entraînement pour pouvoir analyser des phrases à plusieurs verbes, 
car il n’a pas étudié la phrase complexe. 


Tenant compte de cette difficulté, j'ai tendance à ne plus utiliser de conjonc- 
tions dans un exercice de géométrie, mais plutôt à numéroter les étapes du 
programme de construction ou à passer à la ligne à chaque nouvelle étape de 
la construction. La méthode semble efficace. Mais son emploi systématique ne 
favorisera pas la maîtrise de ces conjonctions par l’élève. 


En se référant aux exercices de géométrie de leur manuel, on se rend compte 
que très peu de conjonctions de coordination sont utilisées dans les programmes 
de tracés. 


1.4 Le langage mathématique 


1.4.1 Un vocabulaire et des notations spécifiques 


Enseigner les mathématiques revient en grande partie à enseigner l’utilisa- 
tion correcte d’un langage spécifique. Il s’agit de faire traduire dans ce langage, 
qui doit s’efforcer d’être rigoureux, un raisonnement logique qui est plus ou 
moins confus dans la tête des élèves. 

Comme on le dit en [3], l’élève doit être capable d'employer correctement 
le vocabulaire de l’arithmétique, de la statistique et de la géométrie dans tout 
type d'activités, et doit pouvoir manipuler les notations spécifiques. 


Il faut reconnaître que ce vocabulaire et ces notations sont un obstacle pour 
l'élève dans son processus de compréhension de l’énoncé. 


SExtrait d’un Bulletin Officiel de l'Education Nationale. 
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1.4.2 Un langage spécifique. 


Les mathématiques et le français sont étroitement liés de par leur rapport 
avec le langage. En effet, les notions, les théorèmes, les définitions ne sont 
accessibles que par divers modes d’expression. On peut citer : la langue natu- 
relle (le français), ainsi qu’une écriture symbolique ayant ses propres règles de 
fonctionnement, mais qui sont différentes de celles de la langue naturelle. 


La langue naturelle utilisée en mathématiques présente des usages gramma- 
ticaux peu utilisés dans d’autres contextes. De plus, les tournures spécifiques, 
de par leur sens ou leur structure, laissent plus d’un élève perplexe. Nous 
pouvons citer comme exemple : « soit...., on considère ...., ABC est un 
triangle... ». 


Une compréhension de ces tournures va donc nécessiter un apprentissage 
qui reposera sur la loi de « l’habitude ». Plus l’élève sera confronté à ce genre 
de tournures, plus il les maîtrisera. 


1.4.3 Complexité de l’énoncé. 


Nous devons avouer que les textes mathématiques (en particulier ceux de 
géométrie) sont souvent complexes. Cette complexité va en grandissant selon 
les cycles scolaires. Les phrases sont souvent longues et présentent une grande 
quantité d’informations. Une des raisons de cette complexité est la spécifi- 
cité des objets mathématiques. En effet, un objet mathématique est souvent 
déterminé en fonction d’autres objets. Le cercle est déterminé entre autre à 
l’aide de son centre et un point, la perpendiculaire à une droite par le point 
dont elle est issue et la droite en question. Ces phrases engendrent également 
une grande complexité syntaxique des groupes nominaux et font intervenir 
un grand nombre de prépositions qui y jouent un rôle fondamental. On com- 
prend mieux en quoi la maîtrise de la langue française est importante dans la 
compréhension des mathématiques. 


L'élève doit pouvoir reconnaître et exploiter toutes les informations du texte, 
afin de résoudre un exercice. Pour beaucoup d’élèves de ma classe, cette tâche 
est très délicate, voire impossible à réaliser. Cela se justifie sans doute parce 
que l’élève de sixième n’est pas capable de lire n’importe quel texte (cf. Sec- 
tion 1.3.3). 


À en croire un ouvrage du CNDP, « ... un texte est d'autant plus lisible qu’il 
contient des indications facilement accessibles quant à la manière de traiter 
les informations » [1]. 


Toutefois, selon Jean-Michel Zakhartchouk, l’enseignant ne doit pas pour 
autant sombrer dans la « dérive du trop facile » ([11], p. 34), attitude qui 
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consiste à trop guider l'élève à travers l’énoncé, afin d'améliorer la lisibilité et 
la faisabilité des exercices. 


1.4.4 Difficultés liées aux problèmes numériques 


Les difficultés rencontrées par les élèves lors de la résolution de problèmes 
numériques datent de l’école primaire et sont de deux ordres : difficulté à se 
représenter mentalement les choses et difficulté à les modéliser. 


Dans sa conférence donnée à l'IUFM de Guadeloupe en avril 2003, Mon- 
sieur Debüû affirme que pour pallier les difficultés de modélisation, nous devons 
développer chez l’élève l'emploi de dessins ou de schémas (patates, schémas 
segmentaires, ...). Ceci n'étant pas une activité spontanée dans la résolution 
de problèmes, elle nécessite donc un apprentissage (cf. Section 1.5.4, Expé- 
rience 4). 


1.5 L’approche expérimentale 


Selon Alain Descaves ([5], p. 26), pour améliorer les compétences des élèves 
concernant la lecture et la compréhension des énoncés, il faut : 


- systématiser cette activité, 
- varier les énoncés afin de rendre les élèves plus sensibles à leurs caractéris- 
tiques, 
- développer chez l'élève un apprentissage de la représentation et de la ma- 
thématisation, 
- rendre l’exercice de résolution d’un problème moins solitaire grâce aux 
interactions entre élèves. 
C’est en nous appuyant sur ces considérations que nous allons bâtir nos 
expériences qui seront réalisées en classe de sixième. 
Parmi les compétences que l’élève doit acquérir pour devenir autonome face 
à un énoncé mathématique, on peut citer : 
- Savoir lire seul l’énoncé silencieusement et jusqu’au bout. 
- Etre capable de pointer du doigt ce qu’il ne comprend pas dans l'énoncé, 
mais ne pas être paralysé par des incompréhensions partielles. 


- Pouvoir relier la consigne aux savoirs et savoir-faire acquis précédem- 
ment. 


Concernant le deuxième point ci-dessus, je me suis efforcée à inciter l’élève 
à être le plus explicite possible concernant sa difficulté. Je dois avouer que cela 
est une étape difficile à respecter, dans la mesure où elle nécessite du temps et 
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demande un effort supplémentaire à l’élève, celui-ci étant amené à expliciter 
sa difficulté, et non à se cantonner à répondre « je ne comprends rien ». 
Les réponses au questionnaire témoignent de leur incapacité à véritablement 
prendre conscience de leurs difficultés. À la question « Savez-vous trouver des 
pistes de solutions à partir d’un énoncé ? », et sur les 14 élèves ayant répondu 
au questionnaire, 12 répondirent « oui », ce qui n’est pas forcément vérifié 
dans la pratique... 


1.5.1 Le petit dictionnaire 


Comme je l’ai expliqué à la Section 1.3.3, certains élèves ne comprenaient 
pas la signification de quelques verbes d’action utilisés dans la consigne, et 
ainsi, n’arrivaient pas à percevoir qu’elle était la tâche qui leur était demandée. 
Et ce n’était pas en reprenant les explications oralement que la situation se 
débloquait. 

J’ai donc décidé, de définir la plupart des verbes d’action que l’on retrouve 
dans les consignes et d’en laisser une trace écrite sur leur cahier de cours. 


> Expérience 1 


Lors d’une séance de soutien collectif , quelques courts énoncés sont donnés 
(cf. Annexe 2). L'objectif n’est pas de résoudre les exercices, mais d’essayer 
d'expliquer la tâche qui est demandée à travers les verbes écrits en gras. 


La recherche se fait par groupe de quatre. Après quinze minutes de recherche, 
les propositions de chaque groupe sont collectées et écrites au tableau. Puis, 
commence alors un débat pour trouver celles qui traduisent fidèlement le verbe 
écrit en gras. 


Certains verbes comme placer, construire, tracer, effectuer, recopier, mesurer 
et compléter, ne posèrent pas de problèmes, puisque les élèves y sont confrontés 
depuis l’école primaire. Le verbe nommer qui est introduit normalement en 
sixième avec les figures géométriques, ne posa non plus aucune difficulté. 


Le débat eut lieu avec les verbes reproduire, justifier, calculer (la longueur 
de [AB)), encadrer et coder. De plus, le terme « consécutif » laissa plus d’un 
élève perplexe. 

Concernant le verbe comparer, seules les quatre meilleures élèves me don- 
nèrent la réponse quasi-correcte. En effet, dans leur définition il manquait le 
cas où les nombres sont égaux. Mais, les autres élèves, en suivant mes direc- 
tives, purent compléter la définition. 


Le verbe calculer, dans la formulation « calculer la longueur du segment 
[AB] », fit émerger deux définitions. Pour certains, il fallait mesurer le seg- 
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ment [AB] et répondre que le segment [AB] mesure... Pour d’autres, il fallait 
trouver la longueur de ce segment à l’aide de calculs (en particulier l’inégalité 
triangulaire). Ceux du premier groupe ne faisaient aucune différence entre cal- 
culer la longueur du segment [AB] et mesurer le segment [AB]. Cette attitude 
est encore plus suspecte, du fait que dans la formulation « calculer les sommes 
suivantes », il n’y a aucune ambiguïté et qu'il faut effectuer des opérations. 


Dans chacun des exercices suivants, expliquer la tâche qui est demandée à travers les verbes 
écrits en gras. On ne demande pas de résoudre l'exercice. 


Exercice 1 
Sur la droite graduée ci-dessous, placer le point A d’abscisse 2,5. 


) A 
+ — à — 5 ——+— 
Exercice 2 


Construire 3 points À, B et C non alignés. 
Tracer la droite (AB ) en rouge. 


Exercice 3 : 
Effectuer les additions suivantes : 3,27 +0,1= ; 71,12 + 13 = 
Exercice 4 
Recopier et compléter les phrases suivantes avec les mots : « addition », « somme », 
« terme ». 
5,35 + 2,7 = 8,05 
Cette opération est .…. 5,35 et 2,7 sont les .…. 8,05 est 
Exercice 5 
Comment peut-on nommer cette droite ? 
L ni Lis 

———— #——— + 

Exercice 6 


Reproduire cette figure sur votre cahier en respectant les dimensions. 


M N 
D 
Exercice 7 


Tracer un segment [AB] de longueur 6 em. Placer le point O sur ce segment [AB] tel que 
AO=3 cm. Le point O est-il le milieu du segment [AB] ? (Justifier votre réponse). 
Coder votre figure convenablement. 


Exercice 8 
Tracer un segment [EB] tel que EB= 8 cm. Placer un point A sur le segment [EB] tel que 
AE = 3cm. Calculer AB 


Exercice 9 


Encadrer les nombres décimaux suivants à l’aide de deux nombres entiers consécutifs : 2,75 ; 
3,01 ; 14,87. 


Exercice 10 
Comparer les nombres entiers suivants : 3 et 5 ; 18 et 18,0001 ; 26 et 12. 


Annexe 2 
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Ce conflit vient peut-être du fait que pour eux, certains verbes comme cal- 
culer sont propres à l’algèbre et que d’autres comme mesurer sont relatifs à la 
géométrie. Car à leur stade d’apprentissage, on ne fait les calculs proprement 
dits que dans les problèmes numériques et la construction des figures qu’en 
géométrie. 

Finalement, à l’issue du débat, je tranche en disant laquelle des deux pro- 
positions est correcte pour le calcul du segment [AB]. 


Concernant l’expression « encadrer par deux entiers consécutifs », personne 
ne put répondre. Deux difficultés semblaient surgir de cette phrase : Le verbe 
encadrer, bien qu’on l’ait déjà défini et l'expression « entiers consécutifs ». 


Je pense que, concernant le verbe encadrer, cela doit venir du fait qu’ils 
n’ont pas encore assimilé cette nouvelle définition. Par contre, pour l’expression 
« entiers consécutifs », ce doit être à cause d’un manque de vocabulaire. Il 
me revient ainsi à expliciter cette expression. 


Le verbe coder est un terme nouveau introduit en géométrie. Il signifie 
« mettre le codage mathématique sur une figure présentant quelques particu- 
larités ». Les élèves ayant des difficultés ne comprirent pas la phrase « coder-la 
convenablement ». Ce sont les autres qui expliquèrent cette phrase. 


Le verbe justifier, au niveau du sens ne causa pas de véritables difficultés. Ces 
dernières surgirent lorsque je posai la question suivante : « Si vous rencontrez 
ce verbe dans un exercice de géométrie, où tireriez-vous vos arguments ? ». 
Mon objectif était de les sensibiliser à la notion de démonstration. 

La majorité des élèves répondirent qu'ils tireraient leurs arguments à partir 
de ce qu'ils verraient sur leur « dessin ». 

À ce niveau de l’année, je leur ai simplement répondu qu’il ne fallait pas 
toujours tirer leurs arguments de la figure et que l’on travaillerait sur cette 
question ultérieurement. Je n’ai pas voulu m'étendre davantage, sachant que 
ce n’était pas l’objet de la séance. 


Toutes ces définitions furent collectées sur le cahier de cours et il fut demandé 
aux élèves de s’y référer dès qu’ils ne sauraient pas quoi faire. 


> Constatations 


Après quelques exercices, certains n’ont toujours pas assimilé le vocabulaire 
et n’ont pas la présence d’esprit de reprendre leur cahier de cours pour s’y 
référer. Par conséquent, ils continuent à ne pas savoir quelle est la tâche de- 
mandée. Ce manque de présence d’esprit témoigne d’un manque d’autonomie 
qui n’est toujours pas corrigé. 
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Les autres ont une assimilation progressive du vocabulaire. De temps en 
temps, certains ont quelques trous de mémoire, mais les autres arrivent à les 
combler. Oralement nous sommes obligés de redéfinir ces mots régulièrement. 


> Avis 


La méthode écrite semble ne pas être très concluante. Elle profite davantage 
à ceux qui n’ont pas de difficultés et qui ont déjà pris l’habitude d'apprendre. 
Pour ceux qui en ont le plus besoin, cela semble être un coup d'épée dans l’eau, 
puisqu'ils ne révisent pas les définitions qui ont été précisées, et ne s’y réfèrent 
pas non plus. Mais, je pense qu’une majorité d'élèves a perçu l’importance du 
vocabulaire. 


En tout cas, à partir de cet instant, j’ai pris le temps de redéfinir tous les 
mots spécifiques et en particulier, les verbes, que l’on retrouve souvent dans 
les exercices. 


Le souci de la maîtrise du vocabulaire étant quasi-présente, une autre expé- 
rience est menée sur ce thème : celle des figures « téléphonées ». 


1.5.2 Les figures « téléphonées » 


La maîtrise de la langue est une priorité de l’enseignement au collège. Les 
mathématiques y contribuent à travers la production de textes mathématiques, 
aussi bien à l’écrit qu’à l’oral. Chaque élève doit apprendre et parvenir à s’ex- 
primer clairement et c’est à nous, enseignants, de lui faire ressentir la néces- 
sité d'utiliser un langage précis. C’est pourquoi l’ouvrage « Mathématiques 
en sixième » [3] suggère de travailler avec l'élève sur « l'écriture d’énoncés 
à destination d’autres élèves », en particulier dans la description de figures 
« téléphonées ». 


L'expérience que je présente ici, avait aussi pour objectifs de : 


montrer à l'élève l’intérêt d'utiliser un vocabulaire précis, 


savoir décrire une figure géométrique, 


savoir suivre des directives, 


forcer l’écoute. 


> Expérience 2 


L'expérience se déroule lors d’une séance de deux heures et se présente sous 
forme de jeu avec une récompense à la clé. La perspective du jeu et de la 
récompense a pour effet de motiver davantage la classe. 
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Pour préparer l’activité, je distribue un texte comportant une figure et un 
énoncé à trous, en demandant de le compléter. Cet énoncé à trous présente 
un programme de construction de la figure donnée, et permet aux élèves de 
comprendre ce que l’on attend bientôt d’eux. Cet exercice n’a posé aucune 
difficulté particulière. Le jeu pouvait donc commencer. 


La classe est séparée en trois groupes de cinq élèves. J’ai constitué les 
groupes de façon à ce qu’il n’y ait pas de grande différence de niveau entre 
eux. Mis à part cette question d'équilibre entre les différents groupes, je me 
suis efforcée de mettre au sein d’un même groupe des élèves qui, en temps 
normal, n'auraient jamais envisagé de travailler ensemble. 


La séance se déroule donc de la façon suivante : Chaque groupe choisit un 
chiffre entre 1 et 6, chiffre qui correspond à une figure géométrique différente. 
Pendant vingt minutes, chaque groupe travaille sur son programme de tracé. 
Après ces vingt minutes de recherche, chaque groupe désigne un orateur qui 
aura pour mission de lire son programme de tracé. 


Le jeu se déroule en trois manches. À chaque manche, une équipe expose 
son programme et un représentant de chacune des deux autres équipes est 
désigné. Les représentants travaillent simultanément au tableau et doivent 
réaliser la figure décrite par l’orateur. Tous les élèves, hormis ceux de l’équipe 
qui exposent doivent réaliser la figure, car si leur représentant au tableau 
n’y arrive pas, ce sont les figures correctes réalisées dans leur équipe qui leur 
rapporteront des points. 


La répartition des points est la suivante : 

e Si la personne au tableau réalise correctement la figure, elle rapporte 6 
points à son équipe. 

e Chaque figure correcte réalisée au sein d’une équipe rapporte 1 point. 


e Si le programme de construction est correct (cela est décidé par le profes- 
seur et les élèves), l’équipe qui expose gagne 5 points. Sinon, elle en perd 1. 

La personne qui expose n’a, à aucun moment, le droit de donner des expli- 
cations sur son programme. Elle est uniquement autorisée à répéter ce qu’elle 
a écrit sur sa feuille. 


> Les résultats de l’expérience 


[On se reportera aux Annexes 3.a, 3.b et 3.c.] 


Dans les groupes 1 et 2, la recherche s’est faite individuellement par écrit, 
puis après une délibération au sein de chaque groupe, un programme de tracé 
final a été rédigé. Dans le groupe 2, il y a eu une mise en commun des informa- 
tions, puis un véritable débat avant de se mettre d’accord sur le programme 
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final. Dans le groupe 3, la recherche s’est faite oralement. Ensuite, ils se sont 
tous mis d’accord sur le programme qu'ils allaient rédiger. Chacun écrivit sur 
sa feuille ce qu’il avait entendu. 


Le groupe 3 fut le premier à sentir l’importance de définir exactement chaque 
objet. Je m'explique : ils me demandèrent s’il était encore possible de choisir 
quelqu'un d’autre pour exposer le programme de tracé, car selon eux, celui 
qu’ils avaient choisi au préalable ne dirait pas au moment propice « segment », 
« droite », etc. Par exemple, au lieu de dire « coupe le segment [AB] en E », 
il dirait « coupe « AB » en E ». Je les autorisai donc à changer d’orateur. 


Lorsque Maddly exposa le programme du groupe 2, elle fit bien attention de 
parler d’angles C'BA et CAB, mais lorsqu'elle lut les deux dernières phrases 
de son programme, elle omit le terme « droite » dans « parallèle à (AB) » et 
« coupe (CB) en L ». 

Cette omission ne sembla pas gêner les deux élèves qui étaient au tableau. J’ai 
donc pénalisé son équipe, ce qui conforta les élèves du groupe 3 dans l’idée 
qu’il fallait bien définir les objets lorsque l’on s’exprimait. 


Puis, vint le tour d’Olivia d'exposer pour le groupe 3. À ce niveau du jeu, son 

équipe menait largement et normalement, était censée gagner. Tout se dérou- 
lait convenablement. Elle fit attention de bien préciser si les objets considérés 
étaient des droites ou des segments. Les deux élèves au tableau, ainsi que les 
autres, réalisèrent jusque là, la figure convenablement. 
Un léger brouhaha survint lorsqu’elle lut la dernière phrase. En effet, elle oublia 
de préciser le point par lequel la droite perpendiculaire à la droite (C'P) était 
issue. Ephanielle s’en rendit compte et essaya de la prévenir en le lui soufflant, 
mais elle n’y porta pas attention. Les élèves au tableau sentirent qu’il manquait 
une information puisqu'ils ne savaient pas où tracer cette droite. La règle du 
jeu ne permettant pas aux élèves de poser des questions, mais les autorisant 
seulement à demander à Olivia de répéter cette dernière phrase, les nombreuses 
tentatives d'Ephanielle n’attirèrent pas l’attention d’Olivia sur la possibilité 
qu'il manquait quelque chose dans cette phrase. 

Lorsque je montrai la figure que l’on aurait dû trouver les élèves dirent qu’ils 
n'avaient pas trouvé la figure correcte, parce qu’Olivia avait oublié de préciser 
que la droite passait par le point P. 
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> Avis 


L'expérience fut très enrichissante pour chacun d’entre nous. L’erreur de 
Maddly, ainsi que celle d’Olivia, me permirent de leur montrer la nécessité 
de s’exprimer clairement en géométrie. Je pense que tous les élèves se sou- 
viendront de cela puisque l’équipe 3 perdit à cause d’une erreur qui pouvait 
être évitée. Ce fut l’équipe 2 qui remporta la victoire, bien que pénalisée par 
erreur de Maddly. 

Tous les programmes avaient été correctement retranscrits oralement et tout 
le monde, excepté quatre élèves, ont correctement réalisé les différentes figures. 


Le programme devant être énoncé oralement, chacun vit la nécessité de se 
taire lorsque l’orateur s’exprimait. Ils se rappelèrent mutuellement à l’ordre 
lorsque quelqu'un, différent de l’orateur, avait tendance à bavarder. Le pro- 
gramme de construction énoncé oralement me permit également de travailler 
sur un énoncé oral avec eux. 


Il est intéressant de noter que dans aucun des programmes de tracé, il n’y 
avait de conjonctions de coordination. Chaque étape était bien segmentée, 
à l'écrit comme à l’oral. Peut-être que le jeu ne se prêtait pas à l'emploi des 
conjonctions de coordination, puisque les directives étaient énoncées oralement 
et que les élèves devaient réaliser la figure simultanément. L’autre explication 
est qu’ils ont peut-être été influencés par l’exercice qui avait été distribué 
initialement. 

En guise de remédiation, on peut imaginer qu'il soit intéressant de reve- 
nir, plus tard, individuellement et par écrit, sur ce même type d’exercices, en 
imposant cette fois-ci l'emploi des conjonctions de coordination. 


1.5.3 La reformulation par les élèves 


Au départ, elle était systématique de ma part. J’ai donc changé ma façon 
de procéder. 


L'expérience s’effectue donc durant toute l’année et se présente de la façon 
suivante : Je ne reformule plus la phrase systématiquement dès qu’un élève dit 
ne pas comprendre. Je laisse une phase de réflexion ou de consultation. 


Très peu d'élèves travaillent en binôme dans cette classe. Rares sont ceux 
qui demandent de l’aide à leur camarade de table. Les seuls échanges sont 
synonymes de bavardages. 


Pour revenir à l’expérience, si l’élève en est toujours au même point, je 
soumets son interrogation à une consultation collective. En général, le reste 
de la classe parvient à reformuler le problème pour l’élève en difficulté. Si ce 
n’est pas le cas, je peux prendre le relais. 
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L'avantage de cette méthode est qu’elle permet : 
- un détachement de l’élève vis- à -vis du professeur, 
- un enrichissement du vocabulaire, 


- la vérification de la compréhension des autres élèves qui reformulent. 


1.5.4 Emploi d’un brouillon 


J’ai constaté en début d’année que peu d'élèves prenaient un brouillon pour 
réfléchir. Ce dernier n’était utilisé que dans le cas d'activités numériques et 
ce, uniquement pour effectuer des opérations du type addition, soustraction, 
multiplication... De plus, à chaque fois, les élèves me demandaient s’ils avaient 
droit ou non à un brouillon. 


Bien qu’ils aient tous un cahier de recherche, il leur paraît inconcevable de 
pouvoir y faire des ratures. À priori, à leurs yeux, ce cahier doit être conservé 
propre et ne doit pas faire l’objet de ratures ou d’erreurs. Cette angoisse du 
«cahier propre» généra un manque d'initiatives concrètes, car les élèves pré- 
tendaient réfléchir mentalement. 


Ma première mission concernant ce problème fut de systématiser le brouillon 
et de leur faire prendre conscience qu’ils avaient le droit de se tromper. Il fal- 
lait que le brouillon ne serve pas uniquement à faire des calculs, mais devienne 
un outil de recherche à part entière, en particulier pour les constructions géo- 
métriques. 


> Expérience 3 


Cette expérience est menée au cours d’une séance de travaux dirigés portant 
sur les angles. Les deux derniers exercices de la séance portent sur la construc- 
tion d’un triangle, avec au préalable la connaissance d’un angle et de la mesure 
de la longueur de deux côtés, ou encore de deux angles et de la mesure de la 
longueur d’un côté. 


Ce type d'exercices est une première pour eux. Certes, la construction de 
triangles, à partir de la connaissance de la mesure des longueurs des trois côtés, 
part du même principe, mais ici, la donnée des angles a tendance à compliquer 
la tâche. Les meilleurs élèves s’en sortent relativement sans difficultés, ce qui 
n’est pas le cas du reste de la classe. Ces derniers ne savent quelle démarche 
adopter et peinent énormément à traduire l’information concernant les angles. 


À ce niveau de l’année, l’emploi du rapporteur (nouvel outil introduit en 
classe de sixième) ne pose pas de problème véritable. La difficulté surgit dans 
la recherche de la démarche à adopter. Les bons élèves sont sollicités pour 
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donner une méthode. Mais, il leur est impossible d’en donner une, sans pour 
autant révéler le processus de construction. 


J’introduis donc l’idée de faire une figure à main levée. La démarche est 
nouvelle pour eux. Pour beaucoup d’entre eux, réaliser une figure géométrique 
est une tâche qui s’opère uniquement à l’aide d'instruments. 


Je dessine donc un triangle quelconque au tableau et les invite à le reproduire 
sur leur cahier. Ensuite, je leur demande de porter les informations du texte 
sur la figure, à savoir les noms des sommets, la longueur des côtés et la mesure 
des angles. Les difficultés apparaissent au moment de placer les angles sur 
la figure; ce qui révèle que certains ne maîtrisent pas encore les notations 
mathématiques des angles. 


À partir de la figure à main levée, qui sert de support visuel, je demande de 
construire le triangle proposé dans le premier exercice. 


Cinq élèves sur dix-neuf ne surent dans quel ordre il fallait employer les 
instruments. Après avoir élucidé ce problème (en partant de ce que l’on sait), 
ils furent en mesure de construire le triangle. 


> Constatations 


Mis à part les erreurs venant de la mauvaise position des angles, certains 
élèves furent conditionnés par la figure à main levée à tel point qu’ils refu- 
sèrent de valider la figure correcte qu’ils avaient obtenue, en prétextant qu’elle 
ne ressemblait pas à la figure dessinée sur le brouillon. Ils oublièrent que ce 
brouillon n’était là que pour aider à la construction, et qu’en aucun cas, le 
triangle recherché était similaire à la figure obtenue sur le brouillon. 


Outre ce fait, la méthode fut adoptée pour la construction du deuxième 
triangle et permit à plusieurs d’entre eux de réaliser la construction sans mon 
aide. Le fait d’avoir introduit l’emploi de la figure à main levée sur un type 
d'exercices qu'ils n’avaient pas encore rencontré, m'a permis de leur montrer 
que le dessin à main levée était un véritable outil de recherche. 


Ainsi, l'emploi du brouillon pour aider à la construction de figures géomé- 
triques fut systématisé. 


Le point positif de cette expérience est que cette démarche soit facilement 
adoptée par la majorité des élèves, leur offrant un moyen de réaliser des 
constructions géométriques, tels que des triangles, des losanges etc. 


Une deuxième expérience menée sur l’emploi du brouillon et sur le dessin 
d’une figure à main levée, est décrite dans le paragraphe suivant. Elle a pour 
objectif de montrer que l’on peut parfois utiliser une figure à main levée, pour 
donner du sens à un problème numérique, et par conséquent s’aider à raisonner. 
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> Expérience 4 


Cette expérience est menée lors d’une séance de correction d’un devoir à la 
maison (cf. Annexe 4). Ce devoir fut une véritable hécatombe et en particulier, 
pour le deuxième problème. Treize élèves n’eurent pas la moyenne et parmi 
eux, neuf élèves eurent une note inférieure à 07. Cinq élèves ne réussirent 
pas l’exercice 1, le plus souvent, à cause d’une mauvaise mise en signes du 
problème. Au lieu d’effectuer une soustraction, ils effectuèrent une addition. 


DEVOIR A LA MAISON N°3 
(A remettre le Samedi 14 Décembre 2002) 


Problème de taille 


Debout sur un tabouret de 50 cm de haut, Eve « mesure » 1,96 m. 
Guy, debout sur une table de 75 cm de haut , « mesure » 2,17 m. 
Léa , debout sur une chaise de 4,3 dm « mesure » 1,87 m. 
Ranger ces enfants, par ordre croissant, selon leur taille réelle. 


Problème 

Des agriculteurs ont placé du fil barbelé autour d’un terrain. Ils ont payé ce 176€ . Le fil 
barbelé coûte 4 € le mètre. 

Le terrain est un triangle RIZ isocèle en Z. La base de ce triangle mesure 400 cm. 

Combien mesurent les côtés [ZR] et [ZI] ? 


Annexe 4 


Cette erreur aurait pu être évitée à l’aide d’un dessin (FIG. 1.2). Je l’intro- 
duisis pour le premier cas et leur demandai de porter les dimensions au niveau 
des flèches. Ensuite, je les invitai à faire de même pour les autres cas, puis de 
répondre au problème. 


F1G. 1.2 — Un dessin salvateur ! 
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La plupart de ceux qui s’étaient trompés surent se corriger et expliquer leur 
démarche. 


Le deuxième problème présenta plus de difficultés. Seuls huit élèves sont 
parvenus à le résoudre, dans un premier temps. En effet, pour onze d’entre 
eux, la somme des mesures des côtés de même longueur était 400 cm, soit 
ZR = ZT = 200 cm. Là encore, je leur proposai de faire un dessin à main 
levée afin de résoudre le problème. Le manque de support visuel leur à fait 
défaut. La recherche de la solution prit un certain temps, mais au moins à 
partir du dessin ils arrivèrent à proposer des idées de solution. 


1.5.5 Localisation des « hypothèses » et de la « tâche » 


Savoir repérer les informations d’un énoncé et les tâches à effectuer, est une 
compétence à acquérir afin d'envisager sereinement la résolution de problèmes. 
Dans les exercices canoniques des manuels, cette faculté n’est pas nécessaire. 
Ce qui est tout autre dans la résolution de véritables problèmes numériques 
ou de géométrie. En général, la forme de l’énoncé (cf. Section 1.2.2) peut 
faciliter le travail. L'expérience suivante va consister à repérer les deux parties 
de l’énoncé : la partie informative et la partie directive. 


> Expérience 5 


Cette première expérience consista à travailler sur des énoncés de problèmes 
numériques. Il fallait localiser la partie informative, en tirer toutes les infor- 
mations, puis dire quelle était la tâche demandée ; ce qui revenait à chercher 
la consigne. 


Cette recherche ne posa de soucis à personne. La forme générale des énoncés 
numériques facilita énormément leur travail. 


> Expérience 6 


Cette deuxième expérience se déroula en séance de soutien et porta cette 
fois sur un énoncé de géométrie. Il s’agissait d’y rechercher les informations, 
afin de tenter de faire une démonstration. Les élèves qui sont en soutien ren- 
contrent énormément de difficultés pour prouver un résultat. Souvent, ce genre 
de question est délaissé. 


Parmi les raisons supposées, nous pouvons évoquer d’une part, l’incompré- 
hension de ce qui est précisément attendu à travers les verbes « démontrer », 
« prouver » et « montrer », et d'autre part, la méconnaissance des arguments 
à avancer pour prouver ces résultats. Bien que la démonstration ne soit réel- 
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lement traitée qu’en classe de quatrième, les textes officiels nous préconisent, 
en sixième, à initier l’élève au raisonnement déductif. 


Afin d’aider l’élève dans sa recherche, une feuille méthodologique est dis- 
tribuée (cf. Annexe 5). Personne ne rencontra de difficultés pour répondre à 
la question B. La recherche de la réponse de la question À me permit de me 
rendre compte que 5 élèves sur 9 ne savaient pas repérer les informations de 
ce texte. 


En effet, selon ces cinq élèves, les informations disponibles dans le texte 
étaient que le triangle T'1C' est rectangle en J, que le point 1 est le milieu du 
segment [TA] et que la droite (CT) est la médiatrice du segment [TA]. 


Dans ce cas de figure, ces cinq élèves assimilent ce que l’on doit démontrer à 
une information donnée. Pierre Legrand, dans « Profession Enseignant » [8], 
explique que cette erreur part du fait que, dans certains énoncés, la consigne 
soit souvent mêlée à la partie informative. Une telle position de la consigne 
rend aussi bien difficile la distinction entre les deux parties (informative et 
directive), que la lecture d’énoncés en elle-même. 


Des expériences similaires ont été renouvelées à travers d’autres exercices 
de géométrie et les mêmes difficultés sont réapparues. 


Soutien : le 21/02/03 


D 


Problème : Soit TIC un triangle rectangle en I. 
1. Construire le point A tel que I soit le milieu de [TA]. 
2. Montrer que la droite (CI) est la médiatrice du segment [TA]. 


Méthodologie 


A) Faire la figure et la coder convenablement. 


B) Que veut -on démontrer ? 


C) Que nous faut -il pOur arriver à ce que l’on veut démontrer ? 


D) Qu’avons nous comme données ‘informations dans l'énoncé ? 


E) Exploiter les données informations de 


(étape C ). l'énoncé pour arriver à ce que l’on veut 


Annexe 5 
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La consigne mêlée à la partie informative empêche certains élèves de la 
classe, en particulier ceux qui rencontrent des difficultés en mathématiques, 
de repérer les informations essentielles d’un énoncé mathématique. 

La méthode, qui consiste d’abord à repérer la consigne (étape simple, puisque 
c’est la phrase où l’on demande d’effectuer une tâche), puis de dire que ce qui 
reste est la partie informative, ne semble efficace que pour les problèmes nu- 
mériques. 

Face à des énoncés de problèmes de géométrie, toutes les compétences rela- 
tives à la compréhension d’un texte sont nécessaires, car elles permettent de 
repérer les informations essentielles d’un énoncé. 


1.5.6 Fiches méthodologiques. 
> Expérience 7 


L'expérience de la fiche méthodologique à été menée lors d’une séance de 
soutien et a déjà été présentée dans le paragraphe précédent (cf. Annexe 5). 
L'objectif était d'introduire une démarche, pour que les élèves puissent enta- 
mer un raisonnement déductif et par conséquent, le démystifier. 

Le problème traité est extrait d’un devoir à la maison. Aucun des élèves 
présents à cette séance de soutien n’a répondu à la deuxième question. La 
recherche fut très laborieuse, en particulier aux questions C et D. 


> Constatations et remédiation 


Bien que les caractéristiques de la médiatrice soient connues, l’incapacité 
d'exploiter les informations a quelque peu terni la portée de cette fiche. Les 
élèves n’ont pas perçu, dans un premier temps, que la fiche méthodologique 
avait pour objectif de les aider dans leur démarche. 

Il aurait peut-être été plus approprié de l'utiliser sur des exemples plus 
simples et plus nombreux. Ainsi, le caractère répétitif de l’acte leur permettrait 
de prendre conscience des différentes étapes décrites sur la fiche. 

Cette situation d’échec m’a permis de reconsidérer l’emploi de la fiche mé- 
thodologique. Bien qu’ici, elle n’ait pas eu la portée souhaitée, je ne renie pas 
pour autant son efficacité, car elle peut permettre à certains élèves de débuter 
la recherche d’un exercice. 

Il me reviendra, dans l’optique d’une meilleure approche en géométrie, de 
consacrer une séquence, pour aboutir à la réalisation d’une fiche définissant 
« le contrat méthodologique et pédagogique » en relation avec l’énoncé. 

Toutefois, je réitérai l'expérience de la fiche méthodologique, mais cette fois, 
dans le cas d’un problème numérique. L'expérience se déroula dans le cadre 
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d’une séance de soutien, où la fiche méthodologique (cf. Annexe 6) proposée 
a été tirée du manuel Dimathème 6e. L'exercice problème considéré avait été 
donné préalablement lors d’un contrôle. 


La partie « repérer ce qui est important en résumant les données et les ques- 
tions », se déroula sans heurts, en raison du travail déjà effectué sur ce genre 
de démarche. La difficulté survint lors du résumé des données, sachant que 
pour cette première fois, c’est moi qui notai, de manière concise, les données 
au tableau. 


La situation est imaginée et retranscrite oralement par les élèves. Ils décom- 
posent chaque étape de la situation en la reformulant avec leurs propres mots. 
Afin de les aider dans leur recherche, je leur pose quelques questions intermé- 
diaires. Par exemple, « Que cherchons-nous ? Que nous faut-il pour connaître 
le prix du panier de basket ? À quoi correspond le prix total ? Que nous faut-il 
calculer pour connaître le prix total? ». 


Enoncé 


A la fête de l’école ,les enfants ont vendu 84 gaufres et 5,2 litres de limonade. Une gaufre 
coûte 1,15 € et le litre de limonade coûte 2,15 € .Avec la somme récoltée, la coopérative de 
l’école a pu acheter un panneau de basket. Après l’achat de ce panneau de basket, il ne restait 
plus que 25,6 € pour le voyage de l’école. 

Quel était le prix du panneau de basket ? ( Toutes les opérations seront posées) 


1)Lecture et début de recherche 


Repérer ce qui est important dans le texte en résumant les données et les questions. 


Ce que je sais Ce que je cherche 


Imaginer la situation. 


Peut-être se poser des questions intermédiaires. 
2)Soluti — 
Remarque : Chaque opération est suivie de sa phrase-réponse. 


Annexe 6 
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Suite aux réponses apportées, chacune des opérations est alors écrite, suivie 
d’une phrase-réponse. 

La méthode exposée sur cette fiche méthode a été répétée oralement à chaque 
correction de problèmes numériques, surtout lorsque certains d’entre eux ren- 
contraient des difficultés. 


L'idéal serait qu'ils parviennent, systématiquement, à se poser ce genre de 
questions. Pour se faire, il faudrait qu’à chaque étape, ils conservent une trace 
écrite de la question posée. 


> Avis 


La fiche méthodologique standard pour un type d’exercice donné, en géo- 
métrie ou en algèbre, n’existe pas, tout simplement parce qu’elle mérite d’être 
souvent réadaptée en fonction de l’énoncé, et en fonction de la tâche demandée. 


Cette réadaptation doit être effectuée par l’élève. La fiche, initialement dis- 
tribuée, lui sert alors de support ou de base de réflexion. De plus, s’il parvient à 
accommoder cette fiche ou à s’en détacher, cela sous-entendra qu’il commence 
à développer sa propre démarche de recherche. Par conséquent, l’élève serait 
en train de devenir un élève autonome. 


1.6 Conclusion 


La double mission de l’école, qui est aussi celle du collège, est d’accueillir la 
quasi-totalité d’une classe d'âge dans un même établissement, tout en essayant 
de s’adapter à chacun. Face à cette mission, l'enseignant est quelques fois 
amené à reconsidérer les modalités pédagogiques et méthodologiques, afin de 
mettre l’élève au cœur de l’apprentissage et l’amener à devenir de plus en plus 
acteur et autonome. 


Bien que l’aide de l’enseignant soit appréciable durant les heures de cours, 
l'apprentissage de l’autonomie doit être encouragée. Elle permet à l’élève d’être 
acteur, de voir l’utilité de ce qui est à faire et de mener à bien la tâche qui lui 
est demandée. 


En proposant à mes élèves de sixième des outils, tels que le brouillon et 
la fiche méthodologique, tout en insistant sur la recherche des données et la 
reformulation, mon intention première était de les amener à réagir efficacement 
face à un exercice et à leur proposer des méthodes pour mieux approcher la 
solution. Cette démarche leur permettait aussi de prendre conscience que pour 
réagir efficacement, il fallait au moins essayer et non partir vaincu d’avance. 
Et cela, en s’efforçant de faire des dessins, de rechercher des liens avec le cours, 
de repérer les données essentielles dans un énoncé mathématique... 
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Le processus de compréhension de l’énoncé est un travail de longue haleine, 
qui ne peut être acquis en une année scolaire. Tout au long du cursus scolaire 
de l’élève, qu’il conviendra à chaque enseignant de poursuivre cette tâche, et 
permettre l’apprentissage de l’autonomie, à travers les différents dispositifs 
d’aide personnalisée, tels que les cours de soutien, les modules, les études 
dirigées, les cours de méthodologie... 


Travail fait dans les classes antérieures sur les énoncés et consignes 


A l’école primaire, en ce qui concerne les compétences transversales, nous retrouvons 
dans la partie « Traitement de l'information » les informations suivantes : 

“  Aucycle 1,l’enfant « comprend et exécute une consigne » 

"  Aucycle 2 il sait « utiliser un mode d’emploi, une notice ». 

“ Au cycle 3, il sait «sélectionner les informations utiles et les organiser 

logiquement ». 
Dans la partie « compétences dans le domaine de la langue », sous -partie « lecture », 
nous retrouvons la problématique des consignes, qui se décline de la façon suivante : 

“ En cycle 3, l’élève doit pouvoir « exécuter une consigne » 

" Dès le cycle 2, en expression écrite, l'élève est invité à rédiger des textes 
« prescriptifs » (règles de jeux, règles de vie, modes d'emploi.) après avoir, dès le 
cycle 1, produit des textes de ce type (par exemple des recettes ) en les dictant au 
maître. 

Dans l’ouvrage « Maîtrise de la langue au collège », on précise qu’en cycle 3, chaque 

enfant doit accéder à une attitude de lecteur autonome sur des textes injonctifs (il est 

sous-entendu les textes qui induisent des actions intellectuelles ou matérielles, en 


particulier les consignes scolaires). 


Annexe 7 
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Chapitre 2 


Histoires de groupes 


Histoires de groupes 


(Dominique Hoareau!) 


Résumé : Voici un document de synthèse sur les groupes fi- 
nis que l’on aura plaisir à parcourir. Il regroupe du matériel utile 
si l’on désire passer un concours comme le CAPES ou l’agréga- 
tion, et permet de mettre en oeuvre des techniques spécifiques dans 
les démonstrations comme les passages aux quotients, l’utilisation 
du premier théorème d’isomorphisme ou l’emploi du centre d’un 
groupe. 

Une attention particulière à été portée aux groupes de permuta- 
tions. La section 2.7 propose de tirer avec remise deux éléments 
d’un groupe fini non commutatif G, et de calculer la probabilité 
P(G) pour que ces deux éléments commutent entre eux (théorème 
de Dixon). Enfin la dernière section explicite la structure de cer- 
tains groupes (groupes d’exposant 2, groupes diédraux, groupes 
d'ordre pair ou d’ordre 2p avec p premier impair, théorème de 
Cauchy) d’une façon toujours attayante et en établissant de nom- 
breux parallèles. 

Pas moins de 25 exercices sont proposés, le plus souvent avec une 
solution développée. 


ITUT de Montpellier, domeh@wanadoo.fr. 
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2.1 Division euclidienne dans Z 


2.1.1 Sous-groupes de Z, congruence dans Z 


Propriété 2.1 Les sous-groupes de (Z, +) sont monogènes. Plus précisément, 
les sous-groupes additifs de Z sont de la forme nZ, où n EN. 


Preuve : Les nZ sont des sous-groupes de Z. Réciproquement, soit H un 
sous-groupe de Z, H Æ {0}. La partie H N N* non vide de N à un plus petit 
élément qu’on appelle n. Clairement, nZ € H. À présent, si x € H, par 
division euclidienne, x s'écrit x = nq +7, avec 0 < r < n. Aïnsi r = x — nq est 
dans H et dans N*, et r — 0 par statut de n. Finalement x = ng € nZ. D'où 
le résultat. On retiendra qu’un générateur d’un sous-groupe H ZÆ {0} de Z est 
le plus petit entier naturel non nul qui se trouve dans H. 


Pour a et b entiers relatifs, les sous-groupes aZ + bZ et aZ N bZ s’écrivent 
(de façon unique) dZ et mZ (d,m € N). L’entier d est appelé pgcd de a et b 
(notation : d = a A b), m ppem de a et b (m = a V b). Lorsque d = 1, on dit 
que a et b sont premiers entre eux. 


Soit n € N. On définit la relation de congruence modulo n en posant : 
z=y(n) & zx-yenZ. 


L'ensemble des classes d'équivalence est notée Z/nZ et la classe de x modulo 
nZ est T =7x+nZ. 


Lorsque x = O(n), on dit que n divise x et on note : n | x. 


Propriété 2.2 {lemme de Gauss) 
Si a|bc etaAb=1, alors a | c. 


Preuve : Puisque a A b = 1, il existe u et v dans Z tels que au + bu = 1. On a 
alors c(au + bu) = c, acu + bev = c. Or bc s'écrit bc = ay avec y € Z. Il vient 
a(cu + yv) = c donc a | c.n 


Exercice 2.1 

1) Pour d = a Ab, montrer que d| a et d|b, et que [d'| a; d'|b = d'| d]. 

2) Pour m = aVb, montrer que a | m etb|m, et que [a | m' ; b]m'=m|m|. 
3) Pour m = a V b, montrer qu'il existe a’ et b' dans Z, tels que a! | a, b | b, 
a Ab=1letm= ab. (On pourra décomposer a et b en produits de facteurs 
premiers : 


_ pal Ak DOk+I GA LS OT Br Pr+1 B; 
APT Pr Prii Dj à bp ..pe pr D; 
a! b! 


oùm>B2>20s1<i<ket0<&<B; sik+1<i< 


2.1. DIVISION EUCLIDIENNE DANS Z 51 


Un entier p est dit premier si ses seuls diviseurs sont p, —p, 1 et —1. S'il ne 
divise pas un entier k, alors k A p — 1. 


Propriété 2.3 Z/nZ = {0,1,..,n—1}. 


Preuve : Pour & et a/ distincts entre 0 et n—1, on a a —a & nZ, donc à £ w. 
Par ailleurs, pour m € Z, on écrit m = ng+roù ge Zet0<r<n—1. 
Ainsi:m—-renZet Mm=T.m 


2.1.2 Le modèle Z 


Propriété 2.4 Tout groupe G =< a > monogène et infini est isomorphe à Z. 


Preuve : On considère le morphisme de groupes surjectif f : n + a” de Z 
sur G. Si f n’est pas injective, im,neZ mn, a” = al, donc a"! = 1. 
On considère alors n, le plus petit entier naturel tel que a* = 1. On a : 
{1,a,…,a 1} € Get on montre par division euclidienne l’autre inclusion 
{1,a,.…,a 1} 3 G. Absurde puisque G est supposé infini. m 


2.1.3 Ordre d’un élément 


» Soit G un groupe, a € Get k € Z. Si a* — 1, on dit que k est un exposant 
de a. 


> On montre que l’ensemble £, des exposants de a est un sous-groupe de Z, 
donc €, est un aZ avec à € N. Lorsque & À 0, on dit que a est l’ordre de a 
ou que a est d'ordre &. Sinon, on dit que a est d’ordre infini. 


»> On envisage alors le morphisme surjectif f : kr af de Z sur < a > et la 
relation d'équivalence sur Z définie par : 


ERE +. HR = 
e al 
<  k—Tlest un exposant de a 
& k-lEeE£, = az. 


On vérifie que f : k + f(k) est correctement définie de Z/aZ dans < a >, 
surjective (comme f) et injective ("par construction"). Ainsi < a > est infini 
comme Z/0Z = Z si a est d’ordre infini (< a >= Z/0Z), et {(<a>)=asia 
est d’ordre & £ 0. On a montré : 


Propriété 2.5 Dans un groupe G, l’ordre d’un élément est égal à l’ordre du 
sous-groupe qu'il engendre. 
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> On suppose que G est un groupe fini. L'ensemble M des entiers 4 tels 
que (Va € G_a* — 1) est aussi un sous-groupe de Z : en fait, M — Mec Éa: 
donc M est mZ où m est le ppem des ordres des éléments de Get aussi le plus 
petit entier naturel tel que (Vae G a” = 1). L’entier m est appelé exposant 
de G. Par exemple dans S3 (d’ordre 6), les permutations autres que 1 sont 
d'ordre 2 (transpositions) et d’ordre 3 (3-cycles), donc l’exposant de S3 est 6. 


2.1.4 Groupe cyclique 


Propriété 2.6 SoitG=<a>={1,a,.…, a" 1} un groupe cyclique d'ordre n. 
Alors 

1. Tout sous-groupe H Æ {1} de G est cyclique, engendré par la plus petite 
puissance de a qui se trouve dans H. 

2. Pour 0 < k £<n—1, l’élément aË est d’ordre à = En Aussi, 


<>=G & kAn=l. 


3. Pour tout diviseur d de n, il existe un et un seul sous-groupe de G, 
d'ordre d. 


Preuve : 1. On procède comme pour la caractérisation des sous-groupes de Z. 
On écrit H = {1,aït,.….,aM} où 0 < k1 < … < k;j < n, et par division 
euclidienne de k; par k1, on montre que tout a est une puissance de aït. On 
retiendra qu’un générateur de H est la plus petite puissance de a qui se trouve 
dans A. 


2. On écrit < a >= {1,a"t,...,aka-1} (il y a a éléments dans < a >) où 
O < k1 < … < ka-1 < n. On sait que a* et a“! engendrent le même sous- 
groupe. Or, par statut de à (plus petit entier naturel tel que (a“1)* = 1), 1 
et les puissances a*1, a2%1,..., a(@-1hi de ak1 (au nombre de a) sont distincts. 
D'où nécessairement : 


<a >=< at >= {1,aft, a = 92, gfa-1 2 QD} 
L’entier k1 x a est un exposant de a, donc n | ka. Or, ka-1 = (a — 1)k1 <n, 
donc @k1 — k1 <n, ak <n + k1 < 2n, d'où : n = ki x a. 
Par ailleurs, a* € < a“ >, donc k s'écrit k = k1 x B. 
Enfin, puisque al e< a% >, aM = a%$, k1 — ks est un exposant de a, donc 
s'écrit k1 — ks = nt. Il vient : k1 — k18 s = kiat, at + 6s = 1, donc a AB = 1. 
Puisque par ailleurs n = ka et k = k16, on a k\ = k An et 


n 


A = —. 
kAn 
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3. Existence : Soit d un diviseur de n. On pose & = % et x — a. L'ordre 
de x est d’après ce qui précède : En = + =d. 

Unicité : Soit H un sous-groupe d’ordre d de G (cyclique), soit alors y = a”? 
dans G' tel que H =< y >. Pour g= a e< y >, gŸ = ad — 1, donc il existe 
l € Z tel que ad = In, a = À. Ainsi : g = a° ad (aa)! = (a*)! = x! donc 
gE<x>et <y>C<x>.Puisquef(<y>)=H(<x>), <x>=<y>.R 


Question 2.1 Un groupe dont tous les sous-groupes sont cycliques, est-il né- 
cessairement cyclique ? 


Exercice 2.2 Si G et {1} sont les seuls sous-groupes d’un groupe G non 
trivial, alors G est monogène, fini et d’ordre premier. 


Soit xeG,x £1. On a < x >4 {1}, donc < x >= G. Par ailleurs on a 
<a >= {1} ou <a >=<r>, donc =loubienmimez ()t=x, 
ie. &? = 1 ou 2-1 = 1, Ainsi, G est cyclique de cardinal noté n. Soit enfin 
d | n avec 1 < d < n. Le sous-groupe < æ4 > est d'ordre d & {1,n}, donc 
<axi > {1} et <x4 >4£ G. Impossible! 


2.2 Théorème de Lagrange 


2.2.1 Dans un groupe abélien fini 
Soit G un groupe commutatif fini d'ordre n, et g € G. On pose : 
= Il ds 
xEG 


La translation {, : x + gx est bijective et puisque Gest commutatif, le produit 
dans G ne dépend pas de l’ordre des facteurs. Aïnsi : 


Ê= IPOBIEZ 


xeG xeG 


et toujours par commutativité de G, a = ga. En définitive : 
Ve G ei 


2.2.2 Relation modulo un sous-groupe 


Soit G un groupe. Si H est un sous-groupe de G, on définit sur G la relation 
de congruence (à gauche) modulo H en posant : gRug & gg! € H. Pour 
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g € G, la classe de g est g = {gh; hk € H}, qu’on note aussi gH. L'espace des 
classes est noté G/H. 

On suppose que G est fini. Pour g € G, on vérifie que l’application k + gh 
de H dans gH est une bijection, ce qui assure que toutes les classes ont le 
même cardinal o(H). 

Si on note [G : H] le nombre de classes d'équivalence modulo Rx (indice de H 
dans G), on peut écrire : 


o(G) =[G : H] x o(H). 
On vient d'établir le théorème de Lagrange : 


Propriété 2.7 SiG est un groupe fini et si H est un sous-groupe de G, alors 
l’ordre de H et son indice dans G divisent l’ordre de G. 


Exercice 2.3 Montrer que si G est un groupe de cardinal impair, alors : 
VreG 2lyeG x=Y%. 


Solution : Pour tout x dans G, l’ordre du sous-groupe < x > engendré par x 
divise o(G) = 2k +1, donc x'*+l = 1, et 


2kHL 2 (yk+1)2 2 72 


T=TT y 
en posant y = æ*Tl, L'unicité se montre en notant que y2#+1 = 32##1 2 7 
pour tous y,z € G, et que par conséquent si x = y? — 2°, on obtient 


QE RS y atz = y 2. 
Exercice 2.4 On désigne par S, le groupe des bijections de {1,...,n}. On veut 
calculer son ordre B,,. On définit sur Sn une relation d'équivalence en posant : 
oRo'si, et seulement si, o(n) = a/(n). 

1) Démontrer que R est la relation d'équivalence modulo le sous-groupe 
Hn = {o € Sn ; ofn) =n} de Sn. 

2) Montrer que H, est en bijection avec Sh_1 et que S,/H, est en bijection 
avec {1,...,n}. 

3) En déduire par récurrence que B,, = o(S,) = n!. 
Question 2.2 Si G est un groupe fini d'ordre n et si m est un diviseur de n, 


G possède-t-il un sous-groupe d'ordre m ? La réponse est positive si G est 
cyclique. 


Réponse : Pas forcément, comme on le voit dans la remarque qui suit la 
Propriété 2.20. 
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Corollaire 2.1 L'ordre d’un groupe fini est un exposant de chacun de ses 
éléments : si G est un groupe fini d'ordre n, alors g" = 1 pour tout g € G. 


Preuve : Soit g € G. L'ordre de g est l’ordre du sous-groupe < g >, donc 
divise l’ordre de G, d’où le résultat. mn 


Corollaire 2.2 Un groupe G d’ordre premier p est cyclique. 


Preuve : Soit xeG,xZ£l.Onao(x) > Let o(x) est un diviseur de p, donc 
avec p premier, o(x) = p. Ainsi G=<x>=#{1,x,.,æ? !}.n 


Exercice 2.5 Trouver les sous-groupes de S3. 


Solution : On étiquette les éléments de S3. On trouve l’identité Zd, les trans- 
positions (permutations d'ordre 2) T1 = (2,3), T2 = (1,3), T3 = (1,2), et les 
3-cycles r = (1,2,3), p = r 1 = (1,3,2). Si H est un sous-groupe propre de 
S3, son ordre est 2 ou 3, donc H est cyclique. Ainsi H =< T1 >, ou < T2 >, 
OÙ < T3 >, OU <T >—=< P >. 
$S3 nous fournit un exemple de groupe non cyclique (et même non commutatif) 
dont tous les sous-groupes propres sont cycliques. 


Corollaire 2.3 (Formule des indices) Soient S et T deux sous-groupes de G 
tels que : SCT. Ona:[G:S]=[G:T][T :S1. 


Preuve : e Première méthode : on écrit 


_ o(G) _[G:T1 °(r) 


SE To 


— CTP ES 


e Seconde méthode (preuve directe) : 

- SixS = x'$, alors x_!x! € S, donc x_!lx' € T car S CT, ce qui assure 
que xT = x'T. On définit ainsi correctement une application @ de G/S vers 
G/T en posant @(xS) = xT. 


- Soit R la relation d'équivalence associée à ®, définie sur G/S par : 
zSRzS & (xs) =d(xS). 
On a :2xSR x'S & xRrx', donc le nombre de classes d'équivalence pour R 
est égal à [G : T]. 


-Ona:xS = {x$S ; x E xT} = {xtS ; t € H}. On vérifie que l'application 
tS + xtS de T/S dans xS$S est bijective, ce qui assure que chaque classe xS 
possède [T : $] éléments. On conclut alors aisément. # 
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2.2.3 Congruence dans Z 


» Pour n € N, les classes d'équivalence de Z/nZ sont notées k (où k € Z) 
et l’on a Z/nZ = {0,..,n—1}. Comme (Z,+) est commutatif, on montre 
facilement que : 


k=I et IV = k+I=k +". 


On dit que la relation de congruence est compatible avec la loi additive de Z. 
La loi de composition interne (k,!) - k +1 est ainsi correctement définie, et 
donne à Z/nZ une structure de groupe commutatif. 


Dm Si G =< a > désigne un groupe monogène, on envisage le morphisme 
surjectif f,:n + a" de Z sur G et la relation d'équivalence sur Z : 


TRay + fa(x) = fa(y) 
&  fa(t)fa(—y) =1 
&  fa(t-y)=1 
& x—ye ker(fa). 


Or ker(fa) est un sous-groupe de Z, donc l’ensemble des classes d'équivalence 
pour R, est un Z/nZ. Deux cas se présentent : 

a) n = 0, f, est alors injective et G est isomorphe à Z. 

b) n Z 0, on vérifie facilement que fa :Zæ+ fa(x) est correctement définie 
de Z/nZ dans G, surjective (comme f,), injective et réalise un morphisme de 
Z/nZ sur G. 


On a montré : 


Propriété 2.8 Soit G un groupe monogène. 
1) Si G est infini, G est isomorphe à Z. 
2) Si G est fini d'ordre n, alors G est isomorphe à Z/nZ. 


Remarque : Si G est cyclique, on peut penser qu’il y a autant d’isomor- 
phismes de Z/nZ sur G, que de générateurs de G. 


Exercice 2.6 Si un groupe G possède exactement 3 sous-groupes, alors G est 
cyclique d'ordre p?, avec p premier. 


Solution : Soit x € G, x # 1. Le sous-groupe < x > est différent de {1} 
donc deux cas se présentent : 


a) Si < æ >= G, alors < x > possède un seul sous-groupe propre non 
trivial. Puisque Z possède une infinité de sous-groupes propres, < x > n’est pas 


2.2. THÉORÈME DE LAGRANGE 57 


isomorphe à Z, est donc cyclique. Son ordre possède alors un unique diviseur 
propre et s'écrit nécessairement p?, avec p premier. 


b)Si<zx>£G, {1}, < x > et G sont les trois sous-groupes de G!. Soit 
yEG\<r>.Ona<y>£{l}et <x>£<y>, donc < y >= G. On est 
alors ramené au cas précédent. 


Question 2.3 Il n'y a qu’un seul modèle de groupe d'ordre n premier : Z/nZ. 
Mais peut-on affirmer que n est premier lorsqu'il n’y a qu’un modèle de groupe 
d'ordre n ? 


» On vérifie que la congruence modulo n est également compatible avec 
la loi multiplicative de Z, ce qui permet de définir une loi multiplicative sur 
Z/nZ. Muni de ces deux lois, Z/nZ possède une structure d’anneau. 


> On rappelle que les inversibles de Z/nZ (éléments ayant un symétrique 
pour la loi multiplicative) forment un groupe noté LI(Z/nZ) ou (Z/nZ)*, et 
que 


ke(Z/nZÿ & kAn=l1. 


Propriété 2.9 (Lemme d'Euclide) 
Si p est premier et si p | ab, alors p | a ou p | b. 


2.2.4 Indicatrice d’Euler 


Pour n > 1, on note {n) le nombre des entiers k& € {1,...,n} premiers avec n. 
C’est aussi l’ordre du groupe multiplicatif LI(Z/nZ), ou encore le nombre des k 
du groupe (Z/nZ, +) tels que le sous-groupe < k& >= {jk ; j € Z} engendré 
par k soit égal à Z/nZ; C’est aussi le nombre des générateurs d’un groupe 
cyclique d'ordre n, ou enfin le nombre des éléments de (Z/nZ,+) qui sont 
d'ordre exactement n. 

Lorsque n = p est premier, Z/pZ est un corps et w(p) = p — 1. Le théorème 
de Lagrange donne : 


Propriété 2.10 (Petit théorème de Fermat) 
Pour p premier et k Z 0 (p), on a : kP-1 = 1. 


Application 2.1 Soit p premier. Dans l'anneau (Z/pZ)[X], on a l’identité : 
p—1 
XP-X=][(X-#). 
k=0 


Conséquences : 


(1) (p—1)!= -1 (p). 
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(2) (X +1) = XP +1 dans l'anneau (Z/pZ)[X]. 

(3) Pour0 <k <p, Ci = 0 Co): 
On constate en effet que le polynôme X?P — X unitaire de degré p admet les p 
éléments k du corps Z/pZ comme racines, donc est le produit des X — k. 


Pour (1), on identifie le coefficient de X dans l'identité précédente. Pour (2), 
on écrit 


XP-X = [[] (X-4) 
kEZ/pZ 
= [[ X-&G-1) 
kEZ/pZ 
= [[ (KX+1-% = (X+1P -(X +0. 
kEZ/pZ 


Enfin, la nullité des coefficients binomiaux CÈ (0 < k < p) s'obtient en déve- 
loppant (2). 


> Comment calculer 4(n), pour tout n € N*? 


1) Pour p premier, w(p) = p— 1. 


2) Pour p premier et a € N, g(p*) = p° —p° 1. 


3) Si met n sont deux entiers premiers entre eux, on démontre que Z/mnZ et 
Z/nZxZ/mZ sont des groupes (et même des anneaux) isomorphes (Lemme 2.1). 
Conséquence : w(mn) = y(m) v(n) dès que mAn = 1. On dit que la fonction 
indicatrice d’Euler 4 est multiplicative au sens de l’arithmétique. 


4) Si n se décompose en facteurs premiers sous la forme n = p{"...p{", alors 


Lemme 2.1 Z/mnZ et Z/nZ x Z/mzZ sont des anneaux isomorphes. 


Preuve : Puisque m et n sont premiers entre eux, on choisit m’,n/ € Z tels 
que mm/+nn = 1. Pour p,p’,q,q appartenant à Z, p = p'(n) et q = q/(m) im- 
pliquent p—-p € nZ, q—-q € mZ, ce qui donne : (p—p')mm'+(q—q'}nn! € mnZ 
ou pmm/+qnn = p'mm/+qnn/(mn). On définit donc correctement une appli- 
cation 6 de Z/nZxZ/mZ dans Z/mnZ en posant : 9 (p, q) = pmm’ + qgnn'. On 
vérifie facilement que 4 ((p, 4) + (p',q')) = d(p, a) + d(p',q'), ce qui fait de @ 
un morphisme de groupe. A présent, si @ (p, q) = 0, alors pmm/+qnn/ € mnZ, 
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donc pmm’ € nZ et comme mAn=m/ An = 1, on a p € nZ. De même, on 
vérifie que q € mZ, donc 6 est injective. Puisque Z/nZ x Z/mZ et Z/nmZ ont 
le même cardinal, finalement, on obtient bien : Z/nZ x Z/mZ = Z/nmZ. 


» Voici une égalité classique : 
Propriété 2.11 n = > an (d). 


Preuve : e Première méthode. On utilise le résultat suivant (une réciproque 
partielle à Lagrange) : 
Lemme : Si G =< a > est un groupe cyclique d’ordre n, pour tout 


diviseur d de n, il existe un et un seul sous-groupe de @ d’ordre d. 


On définit sur G une relation d'équivalence de la façon suivante : pour x et y 
dans G, xRy si, et seulement si, il existe d diviseur de n tel que o(x) = o(y) = d. 
Avec la partie existence du lemme, il y a autant de classes d'équivalence que 
de diviseurs de n. Avec la partie unicité, 


TRY & <T>=<Y>, 


donc la classe de x est l’ensemble des générateurs de < x >, au nombre de 
p(d). Ainsi n = } an P(d)- 


e Deuxième méthode. On raisonne par récurrence sur le nombre ! d’entiers 
premiers de la décomposition de n. Si ! = 1, n s'écrit n = p? avec p premier 
et g € N*. Les diviseurs de n sont 1, p, …, p91, p1, et 


Det) = 1+(p-1)+ (0 -p)+..+ (pp?) + (pt pt) 


din 
Et 


On suppose l’égalité vraie au rang /, et on envisage un entier 


= Qi di +1 
n= [[ ne [Il xn4. 


1<i<I+1 1<i<I 


Les diviseurs de n sont les diviseurs de [[,.;2, p; dont l’ensemble est noté D; 
et les d x Dir où 4 ED, 1<a <a, et d A ph = 1. Par multiplicativité 
de la fonction indicatrice d’Euler et avec quelques factorisations judicieuses, 
on peut écrire : 


+1 


dela) = Sd p(d)+ SN op) > v(d) |, 
k=1 


din deD, deD, 
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puis 


C7 

ss 

ee 
[ 


vs ( +5 70) 
k=1 


din dEeD; 


= [Ha] G+0 0) = ns 
1<i<l 


2.2.5 Groupe (Z/pZ)* quand p est premier 
Nous aurons besoin des résultats suivants : 


Lemme 2.1 Soit G un groupe fini, a et b deux éléments de G d’ordre à et B. 
On suppose que ab = ba et a À 5 = 1. Alors o(ab) = af. 


Preuve : Donnons seulement les grandes étapes de la preuve. On note 7 l’ordre 
de ab. Alors : 


e <a>N<b>={1}. (On pourra calculer x* pour re<a>N<b>.) 
° lab. 

e al|7yet B|7. (On remarquera que (ab)? = 1.) 

ee y—=af.s 


Lemme 2.2 Dans un groupe G commutatif et fini, l’ensemble des ordres est 
stable par ppem. Ainsi, l’exposant m de G défini comme le ppem des ordres 
des éléments de G, est aussi le plus grand des ordres des éléments de G, ce 
qui s'écrit : m=max{o(x); x E G}. 


Preuve : Soit x et y deux éléments de G d’ordre à et B. On prend a et B 
dans Z tels que à | à, B|B,aAB=1et à V B = aB. On pose a = x%/2 
et b — yP/8. L'ordre de a est &, tandis que l’ordre de b est 6. Le Lemme 2.1 
montre que ab est d'ordre aB, c’est-à-dire à V B.m 


Pour p premier, notons indifféremment LI(Z/pZ) ou (Z/pZ)* le groupe multi- 
plicatif de l’anneau Z/pZ. Alors : 


Propriété 2.12 Si p est premier, (Z/pZ)* est cyclique. 


Preuve : On veut exhiber un élément de G = (Z/pZ)* d'ordre p — 1. Un 
candidat naturel est un élément g € G tel que : 


o(g) = max {o(x) ; x € G}. 
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On pose m — max{o(x); x € G}. La stratégie est la suivante : vérifier que 
tout x de G a un ordre / qui divise m. Aïnsi, tous les éléments de G seront 
racines du polynôme X"” —1 de (Z/pZ)[X], ce qui impose p—1 < m et puisque 
par ailleurs m divise p — 1, m=p—1. 

C’est le Lemme 2.2 qui nous permet de conclure : m est le ppem des ordres 
des éléments de G, donc est un multiple de o(x) quel que soit x. 


2.3 Conjugaison and co 


Dans un groupe commutatif, a étant fixé dans G, pour tout g € G,on a 
ga = ag donc gag! vaut a. Dans un groupe non commutatif, gag”! n’est 
plus nécessairement égal à a, et la diversité des résultats pour gag! quand g 
parcourt G, est un indicateur de la non commutativité de G. Par ailleurs, 
gag”! même distinct de a reste proche de a. Ainsi par exemple, les exposants 
de a sont exactement les exposants de gag” !, et o(a) = o(gag” !). 


2.3.1 Sous-groupe distingué 


Deux éléments a et b sont conjugués ou "du même type" dans G si, et seulement 
si, il existe g € G' tel que b = gag” !. On définit ainsi une relation d'équivalence 
appelée conjugaison, qui permet de classer les éléments de G par affinité. 


Exemples : a) Dans R° euclidien, si s est une symétrie orthogonale par 
rapport à un plan P et si f est une isométrie de R, alors f sf! est la 
symétrie orthogonale par rapport au plan f(P). 


b) Deux matrices conjuguées de GL{(n,R) représentent le même automor- 
phisme linéaire de R”, maïs dans des bases différentes. 


c) Dans le groupe symétrique $, de degré n, si o est un p-cycle, alors o s'écrit 
o = (a1,a2,…, ap) et pour T € Sn, Tor lestlep-cycle (r(a1),r(a2), …, T(ap)). 


La classe d'équivalence de a € G est appelée orbite de a et est notée O,. 
Exercice 2.7 On étiquette les éléments de S3 : Id, T1 = (2,3), T2 = (1,3), 


T3 = (1,2), r = (1,2,8) et p = r ! = (1,3,2). Montrer à la main que Sa 
possède trois classes de conjugaison : {Id}, {T1,T2,T2} et {r, p}. 


Exercice 2.8 Dans S3, deux éléments de même ordre sont conjugués. Est-ce 
vrai dans n'importe quel groupe ? 


Solution : Dans $S4, considérer (1,2) et (1,2)(3,4), d’ordre 2 et de parité 
différente. 
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Exercice 2.9 Quels sont les groupes commutatifs G dans lesquels les éléments 
de même ordre sont conjugués. 


Solution : Le groupe trivial G = {1} convient. Soit G Æ {1} commutatif vé- 
rifiant la propriété. Puisque toutes les orbites dans G abélien sont ponctuelles, 
deux éléments de même ordre sont identiques. Soit a € G, a £ 1 et a > 2 son 
ordre. Dans le sous-groupe < a >, le nombre d’éléments d’ordre a est w(@). 
Par nécessité, w(a) = 1. Ainsi, « € {1,2}, et puisque a Z 1, son ordre est 
nécessairement à — 2. On à montré que G à 2 éléments, donc G = Z/27. 
Réciproquement, Z/2Z convient. 


Un sous-groupe de Gest dit distingué (ou normal, ou invariant) dans G, et 
on note H < G!, s’il contient la classe de conjugaison de chacun de ses points, 
1.e. 

VacH VgeG gag ‘eH. 


Get {1} sont toujours distingués dans G. 


Exercice 2.10 Dans le groupe des bijections de R sur R, le sous-groupe des 
bijections monotones est-il distingué ? 


Solution : On pose (x) = 1/x si x Z 0, D(0) = 0, ce qui fait de une 
bijection de R sur R, et on envisage l’application affine croissante f : x + +1. 
Onapofop 1(-1)=0,pofop !(0) = 1, pofop !(1) = 1/2. La conclusion 
est aisée. 


Question 2.4 SiG est commutatif, toutes les classes de conjugaison sont des 
singletons et tout sous-groupe est distingué dans G. Existe-t-il des groupes non 
commutatifs dont tous les sous-groupes sont distingués ? 


Voici un résultat "générateur" d'exemples de sous-groupes distingués (et facile 
à prouver) : 


Propriété 2.13 Si G et G' sont deux groupes et f un morphisme de G 
dans G’, alors ker(f) est distingué dans G. 


Exemples : a) On considère le morphisme signature € surjectif de S, sur 
{—1,1} (qui envoie toute transposition sur —1). Son noyau, appelé groupe 
alterné de degré n et noté 4,, est distingué. La relation d'équivalence sur S; 
définie par : 

oRT & E(o)=e(r) 
est la relation de congruence modulo ker(e) et on définit à bon droit l’applica- 
tion € : Sn/An — {—1,1}, injective (par construction), surjective (comme €). 
Par cette bijection, o(.4,) = n!/2. 
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b) Par le morphisme surjectif déterminant de GL(n, C) (resp O(n,R)) sur C* 
(resp R*), le groupe spécial linéaire SL(n,C) (SO(n, R)) sont distingués. 


c) H étant distingué dans G, peut-on réaliser H comme noyau d’un mor- 
phisme de groupes de source G'? 


Exercice 2.11 Avec des notations évidentes, a-t-on HIKI4G=HA4G? 


Solution : On considère le groupe GA(R) des bijections affines de R formé 
des applications fav : + ax + b avec a € R*,bER. 
Soit T = R le sous-groupe des translations et 77 le sous-groupe des x + x+1n 
(n € Z). Puisque T est commutatif, T7 < T. Par ailleurs, T est le noyau du 
morphisme f46 — a de GA(R) sur (R*, x), donc Test distingué dans GA(R). 
Enfin, l'égalité 
fabfinfas = fabfinfi 2 = fan 


valable pour (a,b) € R*XR et n € Z, montre que 77 #& GA(R) puisqu'on peut 
choisir a € R* et n € Z tels que an & Z. 


Exercice 2.12 Si G est un groupe d'ordre pair o(G) = 2n, et si H est un 
sous-groupe de G d’ordre n, alors H est distingué dans G. 


Solution : Le nombre de classes de congruence modulo H est 2 selon le 
théorème de Lagrange. Soit x € H. H et x H constituent une partition de G!. 
Pour a € H, 

a) Si g € H, gag ! € H puisque H, comme tout sous-groupe de G, est 
stable pour la loi de composition interne. 

b) Si tax ! & H, xax ! s'écrit xh, donc ax ! € H,x te H,xeH 
(stabilité de À pour le passage à l'inverse). Contradiction. On vient de vérifier 


que xax-! € H pour tout a € H. 


1 


c) Si g = xh avec h € H, gag! = x(hah-!)x-!, qui appartient bien à H 


d’après ce qui précède. 
P qui P 


On peut montrer mieux : 


Propriété 2.14 Si H est un sous-groupe d’un groupe fini G, d'indice égal au 
plus petit diviseur premier de o(G), alors H est distingué dans G. 


Preuve : On va réaliser H comme noyau d’un "bon" morphisme de groupes. 
On note Q l’ensemble quotient G/H = {xH;x € G}. Pour g fixé dans G et 
pour x et y dans G, 


z=y(H) & gz=gy(H), 
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donc on définit correctement l’application injective ®, : 7 9x de Q dans Q. 
On envisage alors le morphisme de groupes ® : g9+ 6, de G dans le groupe S 
des permutations de Q (action de G sur Q par translation). Pour g € G, 


gEker(d) & ®(g) = Id QH=H g € H, 


donc ker(®) C H. Par ailleurs, 


et 
o(G) 


CN = o(Im(®)) = ap 


divise o(S) = p! = (p—1)! x p, donc a | (p—1)!. Aïnsi, si a # 1, on choisit (et 
c’est possible) un diviseur premier de a qui est dans {1,..,p—1}. Ce diviseur, 
qui est aussi un diviseur premier de o(G) = o(ker(®)) x ap, est supérieur à 
p (plus petit diviseur premier de o(@)) : contradiction et « = 1. On a donc 
H = ker(®&).… 


Remarque : Peut-on omettre la précision "plus petit"? Non! Dans S3, 
considérer & = (1,2) et Tr = (1,3). Le sous-groupe < © > est d’ordre 2 (et 
d'indice 3) et roaorT ! = (2,3) 4< a > montre que < & > n’est pas distingué 
dans $3. 


Exercice 2.13 Donner une condition nécessaire et suffisante pour qu'un 
sous-groupe < © > de G d’ordre 2 soit distingué dans G. 


Solution : La CNS est o € Z(G). 


Exercice 2.14 L'image directe (par un morphisme de groupes) d’un sous- 
groupe distingué est-elle distinguée ? 


Solution : Non. Considérer 7 E< (1,2)>CS3RTE S3. 


On dit qu’un groupe G est simple lorsque ses seuls sous-groupes distingués 
sont {1} et G. Les groupes cycliques d'ordre premier sont simples, tandis que 
les groupes de permutations $, de degrés n > 3 ne sont pas simples. 
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2.3.2 Centre d’un groupe 


» Vu comme noyau : on peut vérifier que, pour tout a € G,oa : gt aga | 


est un automorphisme de G (dit automorphisme intérieur), et que Int : at 6a 
est un morphisme de G dans le groupe Aut(G) des automorphismes de G. Son 
noyau 


Z(G\={:2eG/VgeG gz=2g} 
et est appelé centre de G. 


»> Centre du groupe linéaire et du groupe orthogonal : Soit K un 
corps commutatif et E un K-espace vectoriel. On note £L(E) l’algèbre des en- 
domorphismes de E et GL(E) le groupe linéaire de E. Lorsque E est un espace 
euclidien (R-espace vectoriel de dimension finie muni d’un produit scalaire), 
on note O(E) le groupe orthogonal de Æ. 

On a la caractérisation suivante des homothéties : 


Lemme 2.3 (1) Un endomorphisme f de E est une homothétie si, et seule- 
ment si, (2) pour tout x € E, la famille (x, f(x)) est liée. 


Preuve : L'implication (1) = (2) est immédiate. On suppose à présent que 
pour tout x € E, il existe un scalaire À, tel que f(x) = Azt. On choisit 10 € E, 
xo Z 0, et on montre que À; = Àx pour tout x € E. On distingue deux cas : 
x € Kro et (x, so) libre. Si x = uxo avec u € K, f(x) = u ÀzoTo = Àro T, Ce 
qui conduit à Az = Àxo: Sinon, 


Arte (t + To) = f(x + to) = f(x) + f(xo) = Art + Àx9T0 


et par liberté de (x, to), Âx+xo = Àx = Àro- M 


Et voici deux résultats importants : 


Propriété 2.15 On suppose E de dimension finie. Le centre de GL(E) est le 
sous-groupe des homothéties de rapport non nul. 


Preuve : Soit f € GL(E) telle que f commute avec tout élément de GL(E). 
Si f n’est pas une homothétie, alors on peut trouver un vecteur x € E 
tel que (ey — x,e2 — f(x)) soit libre. On complète (e1,e2) en une base 
(e1,e2,e3,.…., en). Soit g € L(E) définie en posant g(e1) = g(x) = x = ex, 
g(e2) = x + f(x) = e1 + eo, et g(e;) = e; pour 3 < i < n. Si A1, …, À, sont n 
réels vérifiant 9%, Aig(e;) = 0, alors 


(A1 + À2)e1 + À2e2 + … + Anen = 0, 
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et puisque (e1,….,en) est une base de E, À + A2 = 0, À2 = 0, …, Àn = 0. La 
famille (g(ei))1<i<n est donc aussi libre donc g est un automorphisme linéaire 
de E. Ainsi, x + f(x) = g(f(x)) = f(g(x)) = f(x) donc x = 0. Impossible 
puisque (x, f(x)) est libre. m 


Propriété 2.16 On suppose E euclidien. Le centre de O(E) est {—Id, Id}. 


Preuve : Clairement {—1d,1d} € Z(O(E)). Soit f une isométrie de E qui 
commute avec toutes les autres isométries. Pour D droite vectorielle de E, on 
note sp la réflexion d’axe D. On à dans O(E) : 


Sf(p) = fospof =sp, 


donc f laisse toute droite invariante : f est une homothétie. Son rapport est 
par nécessité 1 ou —1.m 


2.3.3 Equation des classes 


On appelle centralisateur de a, le sous-groupe ©, de G formé des éléments g 
vérifiant gag! = a. C, est formé des éléments qui commutent avec a. On 
vérifie facilement que 


C=G Sa) S" 0; fa} 
où ©, désigne de façon générale l’orbite de a sous l’action de conjugaison, 
c’est-à-dire l’ensemble ©, = {x € G/239 € G x = gag !}. L'application 


Ta : gt gag | constitue un paramétrage de l'orbite ©, et pour mesurer le 
l'surparamétrage", on définit sur G une relation d'équivalence en posant 


es —1 
GRag & gag = gag . 


On vérifie que R, est en fait la relation de congruence modulo C,. Aïnsi, par 
factorisation par le quotient, 7, induit une bijection de G/C, sur ©, et si G 
est fini : 
o(G) = o(Ca)H(Oa). 

Parmi les éléments de G, il y a les "solitaires", les éléments à classe de conjugai- 
son ponctuelle. Ce sont les éléments du centre de G. Soit r le nombre d’orbites 
non réduites à un point et pour 1 < i <r, a; un représentant de chacune de 
ses classes. On a l’égalité 


o(G)=0o(Z(G) +3 [G:C;;], 
i=1 


connue sous le nom équations des classes. Pour une présentation limpide de 
ces concepts utilisant le langage des actions de groupes, voir [1]. 
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2.3.4 Groupes-quotients 


Voici quelques résultats généraux : les preuves manquantes se trouvent par 
exemple dans [4]. 


> Théorème d’isomorphisme : 


1) Les relations d'équivalence sur un groupe G compatibles avec la structure 
de groupe sont les relations modulo un sous groupe distingué de G. 


2) Si H est un sous-groupe distingué de G@, alors G/H muni de la loi de 
composition interne "xH .yH = xyH" est un groupe d’élément neutre H. 
L'application Il : x + T7 = xH est un morphisme surjectif de G sur G/H, de 
noyau À. 


3) Premier théorème d’isomorphisme : Si f : G — G' est un morphisme de 
groupes, alors ker(f) est distingué dans G et le groupe quotient G/ker(f) est 
isomorphe à /m(f). En particulier, S,/A, = Z/27. 


4) On note Aut(@) le groupe des automorphismes de G et Int(G) le sous- 
groupe des automorphismes intérieurs de G. Montrer que G/Z(G) = Int(G). 
On pourra considérer le morphisme Int : a + [o, : g gag !] de G dans 
Aut(g). 


Remarque : Si Gest un groupe d'ordre pair et si H est un sous-groupe de G 
d'indice 2, alors H est distingué dans G (exercice 2.12) et contient tous les 
carrés de G. En effet, on a G/H =Z/2ZetVr e G 3? = x? = 1 doncz? € H. 
En particulier, si {4 d'ordre 12 possède un sous-groupe H d’ordre 6, alors H 
qui contient tous les carrés, contient tous les 3-cycles (c? = 1 = c = (c-1)?) 
au nombre de 2 x Cÿ = 8. Impossible! 


> Groupe dérivé : 


Dans un groupe G, un élément g est dit commutateur s’il existe x et y dans G 
tels que g = xyx y !. Le groupe engendré par les commutateurs est appelé 
groupe dérivé de G et noté D(G). 


1) Pour f morphisme de G dans un autre groupe, 


Im(f) est commutatif si, et seulement si, D(G) € ker(f). 


2) Un sous-groupe H de G qui contient D(G) est distingué et tel que G/H 
est abélien. 
En effet, pour re Get he H, 


che = xh(x Th thx)x 1 = (chx 1h l(hax 1 = (che h Dh 
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est bien dans A. On envisage alors la surjection canonique p : x + T de noyau 
ker(p) = H. Puisque ker(p) contient D(G), Im(p) = G/H est commutatif. 


3) D(G) est le plus petit sous-groupe distingué de G (pour l'inclusion) dont 
le quotient est commutatif. 
2.4 A propos de À; 
2.4.1 Centres de $, et de A, 
Propriété 2.17 Pour n > 3, le centre de S, est trivial. 


Preuve : Soit s dans S, (avec n > 3), s Z Id, à tel que s(i) = j £ 1. Soit, 
à bon droit (n > 3), k différent de à et j, et 7 la transposition (j,k). On a : 
sT(i) = s(i) = j et rs(i) = Tr (j) = k donc s € Z(S,). 


Propriété 2.18 Pour n > 4, le centre de À, est trivial. 
Preuve : Soient o € A», o £ Id, i tel que o(i) = j £ à, k tel que k Æ à, j, 


soient { tel que ! Z à, j,k et enfin définissons 7 = (j,k)(k,l) € A,. Les égalités 
oT(i) = oi) = j et ro(i) = T(j) = k montrent que o # Z(A,).m 


2.4.2 Groupe dérivé de 4; 

On veut déterminer le groupe dérivé de 45. 

Lemme 2.4 Les 3-cycles sont conjugués dans A5 (dans À, pour n > 5). 
Preuve : Soit 7 = (a,b,c) et 7’ = (a/,b',c) deux 3-cycles. Soit o € S5 telle 
que a d,bbet ct d.Sio € As, c'est fini puisque oro ! = 7!. 
Sinon, en écrivant {1,...,5} = {a,b,c,d,e}, on pose o’/ = (d,e)o € A5 et on a 
o'ro! = 7. 

Lemme 2.5 Pour n > 3, les 3-cycles engendrent À,. 


Preuve : On sait que 4, est engendré par les produits de deux transpositions. 
Or, avec des notations évidentes, 


(a, b)(b,c) = (b,a)(b,c) = (b,a)(c,b) = (a, b,c), 


et (a,b)(c,d) = (a,c,b)(a,c,d), donc les 3-cycles sont dans 4, et engendrent 
bien 4». m 


Propriété 2.19 Pour n > 5, on a : D(A») = A». 
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Preuve : Un 3-cycle o et son carré (qui est aussi un 3-cycle) sont conju- 
gués dans À, (Lemme 2.4), donc a? = Tr _lor avec Tr € An. Par suite le 3- 
cycle o = o-!r-lor est un commutateur. Puisque les 3-cycles engendrent 4, 
(Lemme 2.5), on a bien D(A4,) = Ah. 


2.4.3 Simplicité de 4; 


La taille des orbites (pour la relation de conjugaison), comme la grosseur du 
centre et du groupe dérivé, mesurent le défaut de commutativité d’un groupe. 
Par exemple, si Gest commutatif, les classes de conjugaison sont des singletons 
(au nombre de o(G)). Dans un groupe "fortement non commutatif", les sous- 
groupes distingués sont à chercher parmi les gros sous-groupes de G, restriction 
qui laisse penser que les sous-groupes distingués y sont peu nombreux. Aussi, 
malgré l’exemple des groupes cycliques d'ordre premier, on peut s’attendre à 
trouver des groupes simples parmi les groupes fortement non commutatifs. 


On aura besoin de ces deux résultats : 


Lemme 2.6 Les produits de deux transpositions à supports disjoints sont 
conjugués dans A5. 


Preuve : Soit 7 = (a,b)(c,d)(e) et 7’ = (a/,b’)(c,d')(e'). Soit o dans S; 
envoyant a sur a’, b sur b’, …, e sure’, et ao = (c',d')o. 

On a oro 1! = o!ro' |! = r' avec o € As ou 9! € As. D'où le résultat. 
Lemme 2.7 Sir — (a,b,c,d,e) et 7 = (a/,b',c,d',e!) sont des 5-cycles, 
alors Tr” est conjugué avec T ou Tr? = (a,c,e,b,d) dans A5. 


= ( d 0 -c :d: ) 
44. à bi cr de € 
dans S5, qui vérifie r/ = oro-!. Si o est une permutation paire, alors r' est 
conjuguée à 7 dans 45 comme souhaité. Dans le cas contraire, on envisage 
le 4cycle + = (b,d,e,c) = (b,c)(b,e)(b, d), permutation de signature —1 qui 
conjugue 7 et r? dans S3 : r = 7727 !. De là, on écrit 


Preuve : Soit 


D = oro7t = op ot = (oy)r (01) 


où la permutation o7 est dans 45. 


Propriété 2.20 Le groupe A5 est simple. 
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Preuve : e Première preuve (Vive Lagrange !) 
On sait que 45 a 5!/2 = 60 éléments. Les 3-cycles et 5-cycles de S5 sont pairs 
puisque ce sont des carrés (c° = 1 = c= (c-!}? et © =1= c—(c?)?). 
Dans A, il y a : 

- le neutre, 

- les produits de deux transpositions disjointes (d'ordre 2), au nombre de 
ŒC — 15 (on divise par 2 car (a,b)(c, d) = (c, d)(a,b)), 

- les 3-cycles au nombre de Ge x 2 = 20 (pour un même support, on a deux 
3-cycles distincts), 

- les 5-cycles au nombre de 4 x 3 x 2 x 1 = 24. 
On a listé 60 éléments, on a donc toutes les permutations de 45. 


Soit H un sous-groupe distingué de 45, distinct de {1}. Si H contient un 3- 
cycle (respectivement un élément d’ordre 2), il contient sa classe de conjugaison 
et donc tous les 3-cycles (respectivement tous les produits de deux transposi- 
tions disjointes) (Lemmes 2.4 et 2.6). Si H contient un 5-cycle 7, il contient 
aussi 7?, et contient donc n'importe quel 5-cycle 7’ (Lemme 2.7). Ainsi H 
contient le neutre et au moins deux permutations d’ordres différents. Sinon, 
o(H) = 1+24 = 25, ou o(H) = 1+20 = 21, ou o(H) = 1+15 = 16. Impossible 
puisque 25, 21 et 16 ne divisent pas 60. Il suit : o(H) > 1 + 15 + 20 = 36 et 
toujours avec Lagrange, nécessairement o(H) — 60, et H = A5. 


e Seconde preuve (Vive les tricycles !) 


Soit H un sous-groupe distingué de 45, distinct de {1}. Si H contient un 3- 
cycle, il contient tous les 3-cycles (Lemme 2.4), donc H = A5. Si H contient 
un 5-cycle 7 = (a,b, c, d,e), il contient le commutateur (a,b,c)r(a,b,c)-!T-1 
qui est le 3-cycle (a,b,d). Le sous-groupe HA contient alors tous les 3-cycles 
et H = A5. Enfin, si H contient un produit de deux transpositions disjointes 
T = (a,b)(c, d), il contient le commutateur 


T(a,b,e)r” l(a,b,e) 1 = (a,b)(c, d)(a,b,e)(a,b)(c, d)(e,b, a) = (a, b, d) 


donc H = A5. 


Remarque : A5 nous fournit un exemple de groupe ne possédant pas de 
sous-groupe d'ordre égal à un diviseur de l’ordre du groupe : À; simple n’a 
pas de sous-groupe d’ordre 30. 


2.4.4 Sous-groupes distingués de S; 


Si H Z {1} est un sous-groupe distingué de S5, HN A5 est distingué dans 45 
(importance de A5 4 S5), et puisque A5 est simple, À N A5 = A5 ou {1}. Si 
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HN À; est trivial, la restriction de la signature à H est injective, et même 
surjective puisque H Æ {1}, donc H à 2 éléments 1 et o, où o(o) — 2. Avec 
H «5%, on a nécessairement 7 o & o rl = © pour r € $5, donc © est dans le 
centre de S5 : o = 1. Contradiction! Aïnsi, H N A5 = As, A5 C H. Premier 
cas : H = S5. Sinon, par Lagrange, o(H) < n/2, et par nécessité, o(H) = n/2 
et H — A5. 


Propriété 2.21 Les seuls sous-groupes distingués de S3 sont {1}, A5 et Ss. 
On admet que 


Propriété 2.22 Pour tout n > 5 : 
1. An est simple. 
2. Les seuls sous-groupes distingués de S, sont {1}, Ah et Sn. 


Le groupe alterné À, est un sous-groupe de S, d’indice 2 (en fait, c’est le 
seul, cf propriete 2.36 page 89), et S, possède des sous-groupes d'indice n (par 
exemple, Hh = {o € S, ; o(n) = n}). Voici un résultat surprenant : 


Propriété 2.23 {Saut d'indice dans S,) 
Pour n > 5, si H est un sous-groupe de S, d'indice [S, : H] = N > 2, alors 
(Sn: H=N>n. 


Preuve : L'idée est de contruire une injection entre $, (d’ordre n!) et le 
groupe des permutations de Q = S,/H (de cardinal N!). On envisage le 
morphisme ® : s+ [oH + soH] de &, vers So (action de $, sur Q). On 
choisit à bon droit 3 éléments distincts de Q : H, o:H et o2H. Clairement, 
les 3 permutations 1d, &(o1), P(o2) de SQ sont distinctes donc f(Im(®)) > 3. 
Ainsi, Ker(®) est un sous-groupe distingué de S, d’indice supérieur à 3, donc 
Ker(®) = {1} et ® est injective. D'où n! £ N!,n< N.u 


2.5 Carrés non nuls du corps Z/pZ 


Soit p > 2 un nombre premier. Certains résultats algébriques valables dans R 
ou € sont corrects dans le corps Z/pZ. On peut par exemple faire de l’algèbre 
linéaire et étudier les systèmes AX = B où À € GL(n,Z/p2) et B € (Z/pZ)". 
On peut aussi s'intéresser à des équations non linéaires, par exemple celles du 
second degré. Les formules usuelles avec discriminant, sont encore d’actualité 
et on est alors amené à considérer les éléments de Z/pZ qui sont des carrés. 
On pose : K = {x? ; x e (Z/pZ)*}. 
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2.5.1 Morphisme de (Z/pZ)* sur {—1,1} 


Siw:(Z/pZ)* — {—1,1} est un morphisme de groupes non trivial, 4 est alors 
surjective et son noyau est un sous-groupe de (Z/pZ)* d’indice 2. Or le groupe 
(Z/pZ)* est cyclique et d'ordre pair, donc (Prop. 2.6 p. 52) (Z/pZ)* ne possède 
qu'un seul sous-groupe X d’ordre +. On écrit alors (Z/pZ)* = KUxK où x 
a été choisi en dehors de X et & envoie nécessairement tout y de K sur 1 
et tout y € xK sur —1. On a montré qu’il existe au plus un morphisme non 
trivial de (Z/pZ)* sur {—1,1}. 


2.5.2 Un paramétrage de K 


On considère l’application f : x + x? de (Z/pZ)* dans lui-même. On vérifie 
que f est un morphisme de groupes (pour la loi multiplicative), d'image K et 
de noyau ker(f) = {—1,1} (avec 1 Æ —1 puisque p > 2). Ainsi : 


Propriété 2.24 Dans (Z/pZ)*, il y a autant de carrés que de non-carrés : 
autrement dit K possède (p — 1) /2 éléments. 


Exercice 2.15 Soient p > 2 premier, a et b dans (Z/pZ)*. Alors il existe x 
et y dans Z/pZ tels que ax? + by? = 1. 

Solution : Dans Z/pZ, il y a 1 + PT = Pt carrés (on n'oublie pas 0!), 
et par intégrité du corps Z/pZ, les ensembles X = {ax? ; x € Z/pZ} et 
Y ={1-—by ; y € Z/pZ} ont aussi E éléments, ce qui assure X NY £ S. 


2.5.3 Comment reconnaître les carrés ? 


Pour x € (Z/pZ)*, on pose (x) = x°7.. Par le petit théorème de Fermat ou 
théorème de Lagrange dans ((Z/pZ)*, x), le morphisme de groupes @ "tue" les 
éléments de X. Y a-t-il d’autres éléments dans ker(@) ? Le polynôme X Fe 
à coefficients dans le corps Z/pZ a au plus — racines distinctes, d’où la 
caractérisation des carrés de Æ : 


Propriété 2.25 
= 
1. Pour x € (Z/pZ)*, x € Ksi, et seulement si, x 7 =l. 
2. L'application : Th dT., appelée symbole de Legendre, est le seul 


morphisme non trivial de (Z/pZ)* sur {—1,1}. 
En particulier, 


Propriété 2.26 —1 est un carré si, et seulement si, p = 1 (4). 
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Remarque : Une preuve élégante de ce résultat est donné dans la RMS de 
mars 1986 : on envisage sur (Z/pZ)* la relation d'équivalence 


ay & yefx,-z,x 1x 1, 


on montre qu’il y à une seule classe à deux éléments (si —1 n’est pas un carré 
de Z/pZ*) ou deux classes à deux éléments (si —1 est un carré), les autres 
classes au nombre de k ayant 4 éléments. Cette partition de (Z/pZ)* donne 
alors :p—1=2+4koup-1=2+2+4k.. 


2.5.4 Symbole de Zolotareff 


Soit p un nombre premier impair. Pour n entier premier avec p, on note IL,, 
la multiplication par n modulo p (endomorphisme du groupe additif Z/pZ). 
Puisque le corps Z/pZ est intègre, le morphisme Il, est injectif, donc est une 
permutation de Z/pZ. Au passage, on à (p — 1)! = n x (2n) x .… x ((p — 1)n) 
d’où : (n?-1—1){(p — 1)! = 0(p), et on retrouve : 


nl = 1(p) (petit théorème de Fermat). 


On définit le symbole de Zolotareff (n | p) comme étant la signature de II, ,. 


On a, par exemple, (—1 | p) = y (comme on le voit en décomposant 


IL = (1,p —1)(2,p — 2)...(2, 2e), d’où l’équivalence 


(—-1|p)=1 & p=l1(4). 


Par ailleurs, pour (n,m) € Z,nAp=1;mAp=1l,;ona:nmAp=let 
Im,p = Hn,p° np donc par le morphisme signature, le symbole de Zolotareff 
est multiplicatif. 


Propriété 2.27 ({Lemme de Zolotareff) 
Soit p > 2 premier et n un entier premier à p. La signature (n | p) de la 


multiplication Il, par n, est égale au symbole de Legendre (z) ; 


Preuve : Soit x un générateur de (Z/pZ)*. On écrit n = x" avec k € Z et la 


multiplication par n est litérée (5)? . Que vaut la signature e(Ilz p) ? 

Si on écrit Z/pZ = {0,x,x?,.….,æP-1 = 1}, la multiplication par x est un 
(p—1)-cycle, donc est impaire. Ainsi (Il, ») = (—-1)*. Par ailleurs, le symbole 
de Legendre (2) est : n°7 — Caen Or x n’est pas un carré modulo p 
(sinon, tous les éléments de Z/pZ seraient des carrés), donc (2) = (—1)$. D'où 


le résultat. … 
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2.6 Groupes d’ordre p° 


2.6.1 Détermination des groupes d’ordre 4 


» Les 2 modèles : 


Soit G un groupe d'ordre 4 non cyclique. L'ordre de tout élément distinct 
de 1 est un diviseur de 4, autre que 1 et 4 : c’est 2. On peut donc écrire 
G = {1,a,b,c} où a? = b? = €? = 1. L'élément ab est clairement distinct de 
1, a, b, ce qui impose ab = c. On fabrique ainsi sans problème la table de 
composition de G. 

Par ailleurs, on construit facilement un isomorphisme de G sur le groupe 
additif Z/2Z x Z/2Z en posant 6(1) = (0,0), d(a) = (1,0), p(b) = (0,1), 
@(c) = (1,1). G est appelé groupe de Klein et noté V4 (Vierergruppe). 


> Une réalisation de VA : 


Dans le groupe A4 (groupe alterné de degré 4), les produits de 2 transpositions 
disjointes (qui sont d’ordre 2) 


NRA va OA, (bd 0: 


et 1d forment un sous-groupe dont aucun élément n’est d'ordre 4 : c’est W4. 
On peut noter que, pour à, b, c, d distincts dans {1,2,3,4} et pour © dans 44 
(resp S4), 


(a,b)(c,d)a "= o(a,b)a ‘o(c;d)a "= (a(a),o(b)) (a(c),o(d)). 
Ceci prouve que VA est distingué dans 44 (resp dans $4) et que A4 n’est pas 
simple. 


Remarque : On illustre une nouvelle fois la non-transitivité de <. Le sous- 
groupe < u = (1,2)(3,4) > est distingué dans W, lui-même distingué dans 44, 
et pourtant < (1,2)(3,4) > n’est pas distingué dans 44. En effet : 


(1,3) (1,2)(3,4) (1,3) = (1,4)(2,3) & < (1,2)(3, 4) >. 


Puisque {u, v,w} est une classe de conjugaison dans S4, on définit à bon droit 
l'application 


& : ne moe 


2 ++ 02071 


(action de S4 sur {u,v,w} par conjugaison) qui est morphisme de groupes 
de S1 dans Syuvuy = S3. On vérifie que chaque transposition de Su vu} 
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est atteinte, par exemple (v,w) — ®((1,2)). Ainsi, ® est surjective (puisque 
Syuvw} est engendré par ses transpositions), ce qui donne : 


4] 


f(ker(®)) = a — 4. 


Or, Vi = {Id,u,v,w} C ker(®), d’où : 
ker(®)=V1 et S4/Va = S3. 


Interprétation (M. Alessandri) : "il y a 3 façons de grouper 4 objets distincts 
deux par deux. Une permutation de ces 4 objets induit une permutation des 
3 facons de les grouper." 


> Une réalisation géométrique de W : 


Dans le plan affine euclidien, ABCD désigne un rectangle non carré de centre O. 
On cherche l’ensemble TZ (en fait le groupe) des isométries affines conservant 
globalement ABC D. On admet que les éléments de Z sont exactement les 
isométries conservant les 4 sommets À, B, Cet D. Soit f € TZ. L'application 
affine f conserve le barycentre donc f(O) = ©. Par conservation des longueurs, 
l’image de [AB] est soit [AB], soit [CD]. 


- Si f([AB)) = [AB}, alors le milieu 7 de [AB] est fixé. Aïnsi la droite (OT) 
est fixée : f = Id ou f est la réflexion s d’axe (OT). 
- Si f([AB]) = [CD|, alors À est envoyé sur Cou D. 


- Si Ar C, en notant 50 la symétrie centrale de centre O, 50 0 f fixe À 
et O, donc 50 o f = Id, ou s0 0 f est la réflexion d’axe (AC). Ce dernier cas 
est impossible : B serait envoyé sur D, les diagonales (AC) et (BD) seraient 
perpendiculaires, ce qui est exclu puisque ABC'D est supposé non carré. Ainsi 
f = 50. 

- Si A+ D, puisque AD = Df(D), f(D) est nécessairement À. Aïnsi le 
milieu J de [AD] est fixé. On a alors f = Id ou f est la réfléxion d’axe (OJ). 
On vérifie réciproquement que les involutions Jd, so, s(or) et s(oy) sont dans 7 
d’où : 

T = {Id, SO; S(OI): #01} = Va. 


» Sous-groupes du groupe quaternionique Ha : 


On peut montrer que dans GL(2,C), les matrices 


à 0 de d 0 à 
B-Ba=(i SJ) -ms- (2 n)-be={; n)r* — C 
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forment un groupe noté Hg et appelé groupe quaternionique. Soit H un sous- 
groupe de Hs. Si H Æ {1} et H Æ Hs, H possède 2 ou 4 éléments. 


- Si H = {1,7} = Z/27, alors + £ L vérifie y? = 12. Or le seul élément 
de H d'ordre 2 est —12. Ainsi H = {12,-D} et 


VaeHs VheH ghg !=heH. 


- Si H est d’ordre 4 (nécessairement isomorphe à Z/4Z puisque le seul 
élément d’ordre 2 dans Hg est — 12), il est d'indice 2 dans #8, et donc distingué 
dans Hg. Le sous-groupe < a > est un exemple de sous-groupe de Hg d’ordre 4. 


Bilan : Le groupe Hs est non commutatif et pourtant tous ses sous-groupes 
sont distingués. Cela laisse penser que #4 est un groupe des plus commutatifs 
parmi les groupes non commutatifs. Voici aussi un exemple de groupe non 
cyclique dont tous les sous-groupes propres sont cycliques. 


Exercice 2.16 Montrer que D(Hs) = {12,-—-1}. Reconnaître le quotient 
Hs/D(Hs). 


Solution : Hg/{12,-D}, qui est d'ordre 4, est commutatif (isomorphe à 
Z/A4Z ou Va) donc D(Hs) (a {b, —L}. Ainsi, D(Hs3) = {b} ou {b, — DL}. Or 
D(Hs) £ {LD} (sinon Hs serait commutatif), donc 


D(Hs) = {L,-D}. 


Pour tout g € Hs, g° = 12 ou g? = —12, donc tout élément de Hg/{12, —12} 
est involutif. Ainsi, H8/{12, —L}, qui est d'ordre 4, est isomorphe à V4. 


Remarque : Pour tout sous-groupe H de Hg, HN {D,-L} £ {D}. On 
dit que le sous-groupe {12,—12} est dense dans Hg. On note également que 
tout sous-groupe H contient D(Hs) et on retrouve ainsi que H est distingué 
dans Hg. 


Exercice 2.17 Soit G un groupe fini et D un sous-groupe de G contenant 
tous les éléments de G d’ordre premier. Montrer que D est dense dans G. 


Solution : Soit H un sous-groupe de G non trivial. Soit h € H, h £ 1. On 
suppose À € D. On appelle 0 l’ordre de h, qui n’est pas premier. On choisit 
alors un diviseur d premier de 6, et un g €< h > d'ordre d. L'élément g est 
dans H et dans D (par hypothèse). 
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2.6.2 Détermination des groupes d’ordre 9 


Soit G un groupe d'ordre 9. Si G n’est pas cyclique, tout élément x de G\{1} est 
d'ordre 3. Soitae G\{lhetbeG<a>.Onaa =a l£betb=bl#a, 
donc le sous-groupe < a,b > engendré par a et b contient les 9 éléments 
distincts {1, a, a?,b,b?, ab, ab°, a?b, a?b?}. Ainsi G —=< a,b >. L'élément ba, 
clairement distinct de 1, a, a?, et b?, appartient donc à {ab, ab, ab°, a?b?}. 


- Si ba = ab, alors (ba)? — baba — a?b’ba = aa — & — 1, donc 
o(ba) = 2. Impossible puisque 2 ne divise pas 9. 


- Si ba = ab°, alors (ba)? — baba = ab°a = @?. Il vient alors (ba) — b?, 
(ba)® = a?b?, (ba)$ — baa?b? = 1, ce qui est impossible puisque 6 ne divise 
pas 9. 


- On montre de même que si ba = a?b, alors (ba) = 1, ce qui est impossible. 


Bilan : les générateurs a et b de G commutent donc G est abélien. On 
envisage alors l’application 


bp: <a>x<b>— G—{1,a,a°,b,b°, ab, ab°, ab, a?b?}. 


@ est un morphisme surjectif de groupes commutatifs. Comme < a > x <b> 
et G ont même cardinal, @ est un isomorphisme de groupe, et l’on peut écrire : 
Z/3Z x Z/3Z = G. 


2.6.3 Cas général 


Définition 2.1 Un groupe d'ordre p" où p est un entier premier et où k € N*, 
est appelé un p-groupe. 


Lemme 2.8 Le centre d’un p-groupe n’est jamais trivial. 


Preuve : Soit G un p-groupe d'ordre pl. Avec l'équation aux classes, on a 
p} = o(Z(G)) + Der [G : Ci] où T désigne une transversale aux classes de 
conjugaison non ponctuelles. Or pour x € T, [G : C;] > 1 et [G : C;] | pf, 
donc p|o(Z(G)), donc o(Z(G)) > p. 


Exemple : Le centre Z de Hg a 2 ou 4 éléments. Clairement {2,-—D} C Z. 
Si o(7Z) = 4, on choisit x € H8\Z et Z EG ZU{x} C C; donne C; = Hg (avec 
Lagrange), donc x commute avec tous les éléments de Hg. Absurde puisque 
x & Z. Ainsi o(Z)=2et Z = {12,-D}. 


Exercice 2.18 Un groupe G d'ordre p" (p premier, k > 2) n’est pas simple. 
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Solution : - Si G est abélien. Soit re Gr £lSi<r>£G,<x> 
convient. Sinon, < x? > convient. 

- Si G n’est pas commutatif, on a Z(G) £ G, Z(G) £ {1} et Z(G) distingué 
dans G. 


Lemme 2.9 Si p est premier et si G est un groupe d'ordre p°, alors G est 
commutatif. 


Preuve : e Première méthode : On raisonne par l’absurde. Soit x € G\Z(G). 
Le centralisateur C; contient Z(G) (donc au moins p éléments), et x & Z(G), 
donc o(Cx) > p+ 1, et puisque o(C%) | o(G), on a o(Cz) = p°, Cy = G, et par 
conséquent x € Z(G). Contradiction. 


e Seconde méthode : On raisonne par l’absurde en utilisant le lemme 2.10. 
Si G n’est pas commutatif, alors Z(G) non trivial est d’ordre p. Le groupe 
G/Z(G) est d'ordre p premier, donc cyclique, donc G est commutatif. Contra- 
diction. = 


Voici le résultat admis utilisé dans la preuve précédente : 
Lemme 2.10 Si G/Z(G) est cyclique, alors G est commutatif. 


Propriété 2.28 Soit p premier. Il y a exactement deux modèles de groupes 
d'ordre p° : le groupe cyclique Z/p°Z et Z/pZ x Z/pZ. Ces deux groupes sont 
commutatifs. 


Preuve : On suppose G non cyclique. Soit a € G, a Z 1. On à o(a) = p. Soit 
à présent b € G tel que b £ < a >. On remarque qu’on a aussi o(b) = p. On 
envisage alors l’application 6 : < a > x < b > — G définie par @ ((x,y)) = xy. 
Avec G commutatif (d’après le lemme 2.9), on vérifie facilement que 6 est 
un morphisme de groupe. Son image est un sous-groupe de G qui contient 
{1,a,.….,aP-1,b}, donc plus de p + 1 éléments. Comme son cardinal vaut p 
ou p?, c’est p°. Ainsi ® est surjective et G = Z/pZ x Z/pZ. w 


Remarque : Si Gest un groupe d’ordre p? et H un sous-groupe propre de G!, 
alors l’ordre de H est p et H est cyclique. Z/pZ x Z/pZ est donc un exemple 
de groupe commutatif non-cyclique dont tous les sous-groupes propres sont 
cycliques. 


2.6.4 Réciproque de Lagrange dans les p-groupes 


Propriété 2.29 Soit p un nombre premier, k € N* et G un groupe d'ordre 
n = pl. Alors, pour tout diviseur p (0 < m < k) de n = p”, il existe un 
sous-groupe de G d’ordre p”". 
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Preuve : On procède par récurrence sur k. Si & = 1, p premier n’admet que les 
diviseurs 1 et p, et les sous-groupes triviaux de G conviennent. On suppose la 
propriété vraie pour tous les groupes d’ordre p". Soit Gun groupe d’ordre p#+1 
et 0 <m < k+1. Si m = O0, c’est fini puisque {1} est d’ordre p° = 1. On 
suppose m > 0. Puisque le centre de G n’est pas trivial (lemme 2.8), on choisit 
z € Z = Z(G), z # 1. Dans le sous-groupe cyclique < z > dont l’ordre est 
nécessairement une puissance de p, on prend à bon droit À d’ordre p et on note 
H=<h >. Puisque H C Z, H est distingué dans G et le groupe quotient G/H 
(d'ordre p*) possède un sous-groupe À d’ordre pl. On pose : L = 7m -!(K) 
où T désigne la surjection x + % = xH. L est un sous-groupe de G, et la 
restriction de 7 à L est un morphisme surjectif de L sur son image T(L) = K, 
donc L/ker(r|1) = L/H = K, en particulier : o(L) = o(H) x o(K) =p7.# 


2.7 Théorème de Dixon 


Soit G un groupe fini non commutatif. On tire successivement (avec remise) 
deux éléments de G, et on s’intéresse à la probabilité P(G) pour que ces 
éléments commutent (cf [2]). 


2.7.1 Dans S; 


On étiquette les éléments de $S3 : Id, T1 = (2,3), T2 = (1,3), T3 = (1,2), 
r = (1,2,3) et p = r !. La permutation 1d est dans le centre de S3, 7; 
commute avec 1d et 7; tandis que r et p commutent avec Jd, r et p donc la 
probabilité cherchée est 


6+3x2+2x3 1 
P(S3) = ne => 


2.7.2 Théorème 


Propriété 2.30 Soit G un groupe fini non commutatif. On tire successive- 
ment (avec remise) deux éléments de G. Alors la probabilité P(G) pour que 
ces éléments commutent vérifie : 


P(G) < 3 
Preuve : e Remarque préliminaire : Le centre Z(G) étant un sous-groupe de G, 
par le théorème de Lagrange, il existe m € N* tel que : o(G) = m x o(Z(G)). 
Puisque G est non commutatif, Z(G) £ G et m > 2. 
Pour x € G, Le centralisateur C4; de x est aussi un sous-groupe de G@, donc 
il existe k, € N* tel que o(G) = kx x o(C%). Par ailleurs, Z(G) étant un 
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sous-groupe de C%, il existe 7: € N* tel que o(Cz) = jx x o(Z(G)). On peut 
écrire : 

VxeG m=kx x. 
Pour x & Z(G), il existe y € G tel que xy £ yx, donc C; £ G, donc k; > 2. 
De plus x € Cr, donc C4; £ Z(G), donc j; > 2. En définitive, m > 4. 


e Le nombre de tirages possibles est : (o(G)}?. Les couples favorables sont 
dans [J,ec {(æ,y) € G? ; y € Ci}. La probabilité cherchée est donc : 


1 
G= — 5 NC). 
F9 Lo LP 


xeG 


On a : P(G) = may Drez(o) + rez(c), c'est-à-dire 


x#Z(G) 
On peut remarquer que pour æ € Z(G), k; > 2 donc : o(C;) < © (X). 
Ainsi 
1 o(G) 
G)< o(Z(G))o(G o(G)—o(Z(G , 
PQ) < x {o(Z(G) e (G) + 1e(@)- (AG X 2 
o(Z(G)) 1 lo(Z(G)) 11 1 
F6) o(G) à 2 AC) 2m 2 
On rappelle que = < : (&). Il vient : 
po<i +125.» 


2.7.3 Constante optimale 
Si P(G) = 5/8, alors il y a égalité dans l’inégalité (&), donc 
LARG). = 


_ 0o(Z(G)) 
Réciproquement, pour x & Z(G), les assertions k,7: = 4, k; > 2, et jx > 2 
imposent ÿx = kx = 2. Il y à alors égalité dans les inégalités (4) et (&), ce qui 
donne P(G) = 5/8. En définitive, 
5) 
P(G) = = © [G : Z(G)] = 4. 
On exhibera dans la suite du texte des groupes finis G vérifiant P(G) = 5/8. 
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2.8 Théorème de Cauchy 


2.8.1 Groupes d’exposant 2 


Propriété 2.31 Soit G un groupe tel que : Vx € G x? —1. Alors : 
1. G est commutatif. 
2. Si G est fini, o(G) = n est une puissance de 2 (n = 21) et G = (Z/2Z)\. 


Preuve : Pour u et v dans G, on écrit uv uv = 1, donc uvu = v, donc uv = vu. 
Pour la deuxième assertion, on raisonne par récurrence sur l’ordre du groupe. 


Initialisation : Si G = {1,x}, on a bien 2 = 2! et G = 7/27. 
Hérédité : On suppose qu’un groupe dont l’ordre est inférieur ou égal à n—1 


et dans lequel tout élément est involutif, a un cardinal qui est une puissance 
de 2. 


e Première méthode : Soient x1,..,%m € G tels que G =< %1,.,%m > et 
Lin ÉS LiiBin-1 >: Onécrit : 


G = (< T1, Tm—1 ua) : 
—.——, 


H 


On pose : 
G={hË ;heHkeZ}={hr, :heHO0<k<2}=H<zry >. 


La partie G de G est un sous-groupe de G (importance de G abélien), qui 
contient HU {tm}, donc G = G. A présent (h,k) € H x {0,1} + hrk, € Gest 
une application surjective, injective (facile à vérifier), donc n = o(G) = 20(H). 
Avec o(H) < n — 1 et compte tenu de l’hypothèse de récurrence, n est bien 
une puissance de 2. 

On peut ensuite considérer (h,x) € HX <im >hrxeG=H <zm >, qui 
est un morphisme de groupe (importance de G commutatif), surjectif, injectif 
(avec HN < 4m >= {1}), ce qui donne G = (Z/2Z)1. 


e Deuxtième méthode : Soit x € G, x Æ 1. Grâce à la commutativité de G, 
pour tous à,b,a,B € G, on vérifie facilement que & < x >= a < x > et 
B<æx>=b< x > impliquent af < x >= ab < x >. On définit ainsi à 
bon droit une l.c.i sur G/ < x > en posant a <x > b<x>=ab<x >. 
On montre sans problème que G/< x > muni de cette loi a une structure de 
groupe. Dans G/ < x > (de cardinal n/2 < n), tout élément est clairement 
involutif et par hypothèse de récurrence, n/2 est une puissance de 2. D'où le 
résultat. 
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Exercice 2.19 Un groupe dans lequel tout élément distinct du neutre est 
d'ordre 4, est-il nécessairement commutatif ? 


Exercice 2.20 

1) Soit G un groupe. On suppose que le groupe Aut(G) des automorphismes 
de G est d'ordre p > 2 premier. Montrer qu'il existe un entier n > 2 tel que 
G=(Z/2Z}". 

2) En déduire qu'il n'existe pas de tel groupe G. 


Solution : 1) Le groupe Aut(G@) est cyclique (puisque d’ordre p premier) donc 
le sous-groupe Int(G) = G/Z(G) des automorphismes intérieurs est lui-même 
cyclique, donc G est commutatif d’après le lemme 2.10. À présent le passage à 
l'inverse à : gr g ! est un morphisme de G dans lui-même (importance de G 
commutatif), involutif, donc à € Aut(G). Puisque l’ordre de à ne peut être 2 
(qui ne divise pas p), i = Ida. 

Ainsi, tout élément de G est d’exposant 2 et G = (Z/2Z)" avec n > 1 d’après 
la propriété 2.31. On termine en remarquant que Z/2Z n’a qu’un seul auto- 
morphisme, donc nécessairement n # 1. 


2) Le lemme 2.11 ci-dessous montre que Aut(Z/2Z)") n’est pas un groupe 
d'ordre premier. Il n’existe donc pas de tel groupe G. 


Lemme 2.11 L'ordre B,, de Aut((Z/2Z)") est égal à B,, = [[;=9 (2" — 2°). 


Preuve : Les automorphismes du groupe ((Z/2Z)",+) sont exactement les 
automorphismes linéaires du Z/2Z-espace vectoriel (Z/2Z)", donc B,, est aussi 
le cardinal de l’ensemble des bases de (Z/2Z)". 

En effet, en notant (e1,..….,e,) la base canonique de (Z/2Z)", on construit une 
bijection de GL{(n, Z/2Z.,) sur l’ensemble des bases en envoyant toute matrice À 
de GL{(n,Z/2Z) sur (Ae1,…, Aen). 

À présent, pour choisir une base (a1,.….,an) de (Z/2Z)", on choisit a1 quel- 
conque non nul, ce qui donne 2° — 1 choix pour a1. Les vecteurs a1, .…, & 
étant choisis, on prend àa;}1 en dehors du sous-espace vectoriel (a1,.…,a;), ce 
qui laisse 2° — 2 choix pour 4;:1. Ainsi 8, = NS (27 — 25). nm 


2.8.2 Groupes diédraux 

Pour n > 2, on pose : w — exp 7 et pour 0 < k < n, on note Az le point 
d’affixe w*. On veut l’ensemble (en fait le groupe) D, des isométries affines 
du plan euclidien conservant globalement le polygone régulier Ap A1. 1. 
C’est aussi le groupe des isométries conservant l’ensemble { 40, …, An_1} des n 


sommets. 
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Soit f € Dh. L’isométrie f conserve le barycentre donc f(O) = ©. Pour l’image 
de 49, on à à priori n possibilités (par exemple A4) et par conservation des 
longueurs, l’image de A1 est soit À,-_1 ou À,+1 (les images des autres sommets 
étant alors parfaitement déterminées). 

Ceci donne donc l'information : #(D,) < 2n. 


- Si f(4o) = 4o, alors f laisse invariante la droite (O0 A0) donc f est la 
réflexion s d’axe (O0 A0) ou l'identité. 


- Si Ao est envoyé sur un À; (1 <i<n—1),en notant r la rotation 2 + wz 
(de centre O et d’angle #) et & = n—4, la rotation rÀ vérifie r" o f(Ao) = 4o. 
Ainsi, rFo f = Id = r"* ou ro f = 8 = rs. Bilan : f = r° À = ré ou 
f=TrTÉs = ris. 

En conclusion : 

Propriété 2.32 {Id,r,.….,r" ls,rs,.….,r" ls} est le groupe des isométries 
conservant un polygone régulier à n sommets Ao...A,. Îl est est formé de n 
rotations et de n réflexions. 


On démontre que : 


Lemme 2.12 Soit n > 2. Deux groupes G et G vérifiant : 
1) e(G) = o(9) = 2n, 
PlÉ=STSS UE po 
3) o(s) = o(o) =2 eto(r) =0o(p) =n, 
4) o(rs) = 0(po) = 2, 


sont isomorphes. 
Et l’on pose : 


Définition 2.2 Un groupe vérifiant les quatre conditions du lemme précédent 
est appelé groupe diédral d'indice n et noté D. 


Remarques : à) D2 = V4 est commutatif. Pour n > 3, l'égalité srsr = 1 
permet d'affirmer que D,, n’est pas commutatif (sinon o(r) = n = 2). 


B) On illustre une nouvelle fois la non-transitivité de «. On considère pour 
cela le groupe D4 des isométries du plan complexe qui conservent le carré de 
sommets 1, 4, —1 et —i. On note s la symétrie d’axe y = 0 et r la rotation de 
centre © qui envoie 1 sur i. On envisage alors les sous-groupes H = < s > et 
K =<5s,-—Id >. Puisque À est commutatif (ses générateurs commutent), on 
a H<K. Par ailleurs, l'égalité rsr—! = r?s = —s € K\ H montre que H # D4 
et K «D. 
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Exercice 2.21 Soit n un entier naturel > 3. Déterminer selon la parité de n, 
le centre Z et le groupe dérivé D du groupe diédral D, d'indice n. 


Solution : e On commence par une remarque préliminaire : dans le groupe 
D =<r,s >, pour 0 <i< n, r's est une réflexion, donc r°s r°s = 1, donc 


T's = sr ?. 


e Recherche de Z 


- Si n est impair, soit @ € Z, o Z 1. Si @ est une rotation, @ = r' où 
DS nr On lors ds = 0 ro arr = nel 0 = ne | 
Absurde ! Si & est une réflexion, = rs, et rs s = s rîs donner =r 2 =n 
et de nouveau une contradiction avec n impair. En définitive, le centre Z de D, 
est {1} lorsque n est impair. 


k 


- Reste à envisager le cas où n = 2k est pair. La rotation r° commute avec 


toute rotation r°, et avec toute réflexion r°s. En effet, 


k k k+i 


POPS=TSE ET # di: 


=rr es 7 1, 

qui est bien vrai. Une rotation r° (0 < à < k) ne commute pas avec s : si 
rês = sr, ri — 1, ce qui n’est pas. Sir e Zaveck<j<nr Triez 
avec 0 < n — j < k, ce qui est impossible d’après ce qui précède. Clairement, 
s & Z puisque rs = sr conduit à l'impossibilité r? — 1. La réflexion r°s 
(O < à < k) n’est pas non plus dans Z puisque r°s $s = s rs conduit à 
r = 1. De même, rs & Z lorsque k < j < n. Qu'en est-il de r#s? Si 
rês r = 7 rês, rf1l = pktl 32 = ], qui est faux. En résumé, le centre Z 
de Dog est {1,r*} = 7/27. 


e Recherche de D 
1 ee 2 2 


Puisque sr lsr = sr lsr = sr lr ls = sr ?s = r ; r? est un commutateur 
donc < r? >C D. Or < r? > est d'ordre n si n est impair, n/2 si n est pair, 
donc D, /< r? > est d’ordre 2 ou 4. Dans tous les cas, D,/< r? > est abélien 
et D C< r? > (voir section 2.3.4). D'où D =< r? >. 


2.8.3 Une parenthèse : Détermination des groupes d’ordre 8 


Soit G un groupe d’ordre 8. 
e Si G possède un élément d’ordre 8, alors G = Z/87. 


e Si tout élément distinct de 1 est d’ordre 2, la propriété 2.31 montre que G 
est commutatif et G = (Z/2Z)*. 


e On suppose qu'aucune des conditions précédentes n’est réalisée. Pour x 
dans G\ {1}, o(x) = 2 ou 4. On peut choisir a Z 1, o(a) = 4. Soit b #< a >. 
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On a 
G=<a>Ub<a>= {1,a,a°, a°,b, ab, a°b, a°b} 
8éléments distincts 
donc G =< a,b >. On remarque bien que b? € < a >, sinon PP Eb<a>et 


bE< a > (ce qui est absurde). Une première piste pour la construction des 
groupes d’ordre 8 consiste à examiner successivement les cas : 


bP=1, ba ba, b?= a. 
On utilise alors le fait que le sous-groupe < a > d’indice 2 dans G est distingué 
dans @ (cf [4}). 
Voici une autre piste : on a clairement 
ba € {ab, a?b, a°b}. 
- Si ba = a?b, alors ba? = a°ba = a?a°b = b, ce qui est impossible. 


- Si les générateurs a et b de G commutent, par associativité de la loi, G 
est commutatif. On envisage alors à bon droit le sous-groupe < a > x <b> 
de G. Si o(b) > 3, alors < a > x < b > à plus de 8 éléments (ce qui n’est 
pas), donc o(b) = 2. On considère D : (a B)jeE<a>x<b>+mafeG, 
qui est un morphisme de groupe (G commutatif), surjectif. Pour des raisons 
de cardinaux, G<a>x<b>= Z/AZ x Z/2Z. 


- Si l’on suppose que ba = a°b et si l’on tente de remplir la table de G, on 
est vite coincé parce qu’on ne sait pas ce que fait b2. Or o(b) = 2 ou 4. 

a) Si o(b) — 2, alors b? = 1, (ab)? = abab = aa*bb — 1, et on reconnaît le 
groupe diédral Di. 

b) Si o(b) — 4, on vérifie (facilement) que b? # {1, a, a*}, donc b? = a?, et 
on construit entièrement la table de G avec les relations a4 = 1, a? = b?, et 
ba = ab. Gest appelé groupe quaternionique Hs. 

Pour une réalisation de Hg, on peut considérer les matrices 2 X 2 complexes 


à O0 0 1 (D 
Bas Sms ( ÿ)-be=(" g )r (comme 


à la page 76). 


Remarque : Le 2-groupe D4 (ou Hg) n’est pas commutatif et son centre Z 
n'est pas trivial, donc o(Z) = 2 ou 4. Si o(7Z) = 4, un élément x € G\Z 
vérifie : Z G C%, donc Cy; = G, x € Z, ce qui est absurde. Ainsi, o(7Z) = 2, et 
la section 2.7.3 montre que la probabilité P(G') pour que deux éléments de D4 
(ou Hg) pris au hasard commutent est maximale et égale à : 


P(D4) = P(Hs) = à. 
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Exercice 2.22 Considérons à nouveau l’isomorphisme % de groupes de S4 
dans Stuvw} = S3 défini par : 


Dose ne — {u,v,w} 


2 + aza 


(où u, v et w ont été définis à la section 2.6.1). Considérons le sous-groupe 
U—< (v,w) > de Sy vu: Le but de l'exercice est de déterminer P-t(U). 
a) Montrer que ®-!(U) est le centralisateur C, de u. 
b) En déduire que ®-!(U) est d’ordre 8. 
c) Vérifier que Va U {r = (1,2), (3,4)} € &(U). 
d) Montrer que ®-{(U) =< v,T >= Da. 


2.8.4 Cas d’un groupe abélien 


On a besoin du lemme suivant : 


Lemme 2.13 Soient H un sous-groupe d’un groupe commutatif G d’ordre n, 
etx € G d'ordre k. On pose L =< HU{x} >. Alors il existe un diviseur K de 
k tel que : o(L) = K x o(H). 


Preuve : Soit H = {m eZ ; x" € H}. On a k € H puisque x* = 1 donc H 
est non réduit à {0}. Par ailleurs, # est un sous-groupe de Z. Il existe donc 
Kk E N tel que H = KZ. On note au passage que k divise k. 


Le sous-groupe L contient tous les éléments de Æ et toutes les puissances de x, 
donc L = {hx" ; h € H,m € Z} C L. On vérifie par ailleurs que L est un 
sous-groupe de G, qui contient H U {x}, donc L = L. 


Pour m € Z, m s'écrit m = Kq +7 où 0 <r < K. Ainsi 


cH 


ce qui donne L = {hx"; hE H,0 < m < K}. On envisage alors : 
D:(hm)eHx{0,..,k}r hr" e L. 
L'application 14 est clairement surjective. Avec des notations évidentes, 
ha = ha" = a" M EH = Kk|(m/-m) = m=m! 


puisque m,m/ € {0,..,k«}. On vient de prouver que 4 est injective, ce qui 
donne finalement : o(L) = k x o(H).m 


On peut maintenant énoncer : 
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Propriété 2.33 Soit G un groupe commutatif d'ordre n et p un diviseur pre- 
mier de n. Alors G possède un élément d'ordre p. 


Preuve : e Première méthode : Soit x1,...,x, les éléments de G. On écrit : 


G= (< Die. Tn—1 Ut). 
es, 


H 


D’après le lemme 2.13, n divise o(H) x o(x,). Le raisonnement par descente 
est clair jusqu’à : 
n| [[ (x). 


xeG 


Soit p un diviseur premier de n. Il existe x € G tel que p | o(x). Dans le 
sous-groupe cyclique < x >, on choisit alors à bon droit (propriété 2.6 p. 52) 
un élément d’ordre p. 


e Seconde méthode (on utilise le théorème d’isomorphisme) : On appelle x1, 
…, Zn les éléments de G et l1, …, l, leurs ordres. On envisage l’application 
f: (V1, Un) Yi. Yn de < Æ1 > XX < æn > dans (clairement sur) G. 
Puisque G est commutatif, f est un morphisme de groupes, donc 


G=(<r > XX < ?n >)/ker(f). 


Ainsi o(G) = n | l1...ln, p | L1...ln, et il existe un indice à tel que p divise {;, 
c’est-à-dire un élément x de G tel que p | o(x). Dans le sous-groupe cyclique 
< x >, on choisit alors à bon droit un élément d’ordre p (ce qui est possible 
d’après la propriété 2.6 p. 52). 


Remarque : Un diviseur premier p de o(G) = n est l’ordre d’un certain élé- 
ment x de G, et l’ordre de cet élément x divise l’exposant m de G (lemme 2.2), 
donc l’entier premier p est donc aussi un diviseur de m. 


Exercice 2.23 Soient p, q premiers et G un groupe commutatif d’ordre pq. 
Alors G est cyclique. 


Solution : On choisit a, b dans G tels que o(a) = p, o(b) = q. Puisque ab = ba 
etpAg=1l;onaG=< ab>. 
2.8.5 Groupes d’ordre pair 
> Eléments d'ordre 2 


Propriété 2.34 Soit G un groupe d'ordre 2n. Alors G possède un élément 
d'ordre 2. 
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Preuve : On définit sur G une relation d'équivalence de la façon suivante : 
V(a,y)eG aRy & yefx,x !}. 


Soit NV le nombre de classes réduites à un point et N2 le nombre de classes 
à deux éléments. On a : 2n — Ni + 2N2 donc M; est pair. Comme 1 est un 
singleton, M %# 0, donc M > 2. Il existe donc au moins un élément x de 
G\{1} tel que x =x !.# 


Remarques : a) La relation R de la preuve ci-dessus permet d’obtenir la 
congruence de Wilson. Soit p premier. Dans le groupe multiplicatif (Z/pZ)", 
les classes réduites à un singleton sont {1} et {p—1}, et dans le produit (p—1)!, 
on regroupe les facteurs par classe, ce qui donne (p — 1)! = —1 (p). 


B) Et voici une soeur-jumelle de R... Supposons p premier. Si m est un carré 


Si 
dans (Z/pZ)*, le petit théorème de Fermat donne m7 = 1. Si m n’est pas 
un carré dans (Z/pZ)", on considère la relation d'équivalence : 


2Rmy & ye{x,mr |}. 


Les classes suivant R ont toutes deux éléments et en regroupant encore une 
fois les facteurs de (p — 1)! par classe, on obtient : 


Propriété 2.35 Tout groupe fini G vérifiant P(G) = 5/8 a un ordre multiple 
de 8. 


Preuve : [On utilise ici les résultats et les notations de la section 2.7] Si 
P(G) = 5/8, on commence par montrer que tout carré x? de G est dans le 
centre Z(G). En effet, si x € Z(G), alors x? € Z(G) car Z(G') est un sous- 
groupe de G. Et si x € Z(G),on a 


puisque P(G) = 5/8. Donc C; = Z(G)LixZ(G) et nécessairement x? # x7(G) 
(sinon x € Z(G)). 


On a o(G) = m x o(Z(G)) = 4 x o(Z(G)). Il suffit donc de vérifier que Z(G) 
possède un élément d’ordre 2. Soit x € Z(G). On a o(C,) = 2x o(Z(G)), donc 
Cx possède un élément u d’ordre 2 (propriété 2.34). Si u € Z(G), tant mieux. 
Sinon, on choisit y € C>, Cy possède un élément v d'ordre 2. Si v € Z(G), 
tant mieux. Dans le cas contraire, on montre que z = (uv)? est dans le centre 
Z(G) et d'ordre 2. 
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- On a 2 1, sinon uv = vu, Cu = Co, Cx = Cys Y € C>, contradiction. 


- Tout carré est dans le centre, donc z € Z(G). 


-Onauz= u?, vuv = vuu?v = vuvu? = (vu}?u = u(vu)? donc z = (vu)?. 


eZ(G) 


- Enfin : 2? = (uv)? (vu)? = uvuvuuvu = 1. 


Pour le plaisir, voici un autre clin d’oeil aux carrés dans un groupe : 
Propriété 2.36 Pour n > 3, À, est le seul sous-groupe de S, d'indice 2. 


Preuve : Soit H un sous-groupe de $,, d’indice 2. 
- H contient tous les carrés de S$, (cf. remarque p. 67). 


- On sait (cf. lemme 2.5 p. 68) que À, est engendré par les 3-cycles. Or, 
si cest un 3-cycle, © = 1 donc c = (15 ce qui montre que À, est aussi 
engendré par les carrés de $,. On conclut en remarquant que le sous groupe H 
d’indice 2 dans $, contient tous les carrés de $, donc contient 4, et pour des 
raisons de cardinaux, H = AÀ,. 1m 


»> Groupe d’ordre 2p 


Propriété 2.37 Soit G un groupe d'ordre 2p avec p premier. Alors G possède 
un élément d'ordre p. 


Preuve : e Première méthode : Pour a € G, a £ 1, l’ordre de a est 2,p ou 
2p. S'il existe a € G tel que o(a) = 2p, alors G = Z/2pZ, et puisque 2 et p 
sont premiers entre eux, G = Z/pZ x Z/27, L'élément (2,0), par exemple, 
est d'ordre p dans Z/pZ x Z/2Z donc G possède aussi un élément d’ordre p. 
Si pour tout a € G, o(a) = 2, alors o(G) est une puissance de 2 d’après la 
propriété 2.31. Contradiction. 


e Autre méthode possible : on prend a £ 1, b £ 1, b £ a, et l’on remarque 
que < a,b >= {1,a,b, ab}, donc 4 divise 2p, 2 divise p, ce qui est absurde. # 


> Détermination des groupes d’ordre 6 = 2 x 3 


On suppose G non cyclique. Soit r € G, r £ 1, o(r) = 3 (il existe d’après 
la propriété 2.37). On rappelle que le sous-groupe < r > d’indice 2 dans G 
est distingué (exercice 2.12). Soit s € G, o(s) = 2 (il existe d’après la pro- 
priété 2.34). On montre que o(sr) = 2. On a srs = srs”! donc srs € {1,r,r?}. 
Si srs = 1, alors r = 1! Si srs = r, alors sr = rs et l’application 


D:(po)eE<r>x<s>RmpoEeG 
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est un morphisme de groupe. Son image contient {1,p9,p?,s} donc son image 
dont le cardinal divise 6, est nécessairement G. Aïnsi @ est surjectif, donc 
G = Z/3Z x Z/2Z, donc G est cyclique (puisque 2 A 3 — 1). Contradiction. 
Bilan : srs = r?, srsr — r° — 1. Enfin G contient les 6 éléments distincts 
1,s,r,r2,sr et rs, donc G =< r,s >. En définitive, G = D3. 


Comme L)3 est aussi isomorphe à $3, on peut énoncer : 


Propriété 2.38 Un groupe d'ordre 6 est soit isomorphe à Z/6Z (et donc com- 
mutatif), soit isomorphe à Da (ou ce qui revient au même à S3, et dans ce 
cas il n’est pas commutatif). 


Remarque : D3 (isomorphe à S3) est le plus petit groupe non commutatif. 


Voici une conséquence de la propriété 2.38 : 
Propriété 2.39 I! n'existe aucun sous-groupe d'ordre 6 dans A4. 


Preuve : Dans le groupe alterné d'ordre 4, il y a : 

a) L'identité Id. 

b) Les produits de deux transpositions à supports disjoints qui sont d'ordre 2 
et au nombre de 3. On rappelle que ces éléments forment avec /d un sous- 
groupe de 44 isomorphe à V4. 

c) Les 3-cycles 


. 2 3 4 AT sd 
Ua dir EL & 4 1 J? 


TS A ét nd 
en NE AU PET tt AS 


ainsi que les 3-cycles inverses, tous étant d’ordre 3. 


FM MH 
[®S) 
ND 


CO 


On a listé 12 permutations de 44, on les a donc toutes. 


Si A4 possède un sous-groupe H d’ordre 6, on a H = D3 puisque H ne possède 
aucun élément d'ordre 6. On choisit alors un 3-cycle r et un élément s de W 
tels que : o(rs) = 2 et H —=<r,s >. La permutation © = rs appartient donc 
au sous-groupe V4, ce qui impose r = © s € V4. Absurde puisque o(r) — 3. 


Exercice 2.24 
1) Montrer que VA est le seul sous-groupe de A1 d'ordre 4. 
2) Justifier S4/Va = S3. 
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Solution : Soit H un sous-groupe de 44 d’ordre 4. Tout élément de H est 
d'ordre 1, 2 ou 4, et puisque 44 ne possède aucun élément d’ordre 4, tout 
élément de À est involutif. Par nécessité, H = W. 

Par la formule des indices, S1/V4 à 6 éléments, donc est isomorphe à Z/6Z 
ou S3. On pose x = (1,2) et y = (2,3). Le commutateur 


zyx "y = (1,2,3)(1,2,3) = (1,3,2) 


est un 3-cycle donc xy(yx) ! & Va, ty Z yx. Ainsi, S4/Va n’est pas commuta- 
tif, d’où : S1/Va = S3. 


Exercice 2.25 Montrer que le groupe Aut(S3) des automorphismes de S3 est 
isomorphe à S3. 


Solution : Soit T = {(1,2); (1,3); (2,3)} l’ensemble des transpositions de S3. 
Puisque les automorphismes de groupes conservent la période (ou l’ordre) des 
éléments du groupe et puisque 7 est exactement les permutations d’ordre 2 
de S3, on envisage à bon droit le morphisme? 


D: DE Aut(S3)- [rEeT + o(r)] 


de Aut(S3) dans le groupe (isomorphe à S3) des permutations de T. 

Si d € ker(®), alors la restriction de 6 à T est l’identité, et puisque 7 en- 
gendre S3, 6 est l'identité. Ainsi ® est injective, donc Aut(S3) est isomorphe au 
sous-groupe P(Aut(S3)) de S3. À présent, le sous-groupe Int(S3) de Aut(S3) 
des automorphismes intérieurs de S3 est isomorphe à S3/Z($S3) = S3 puisque le 
centre Z(S3) est trivial (propriété 2.17). Il vient f(Aut(S3)) > {({nt(S3)) = 6. 
Avec ce qui précède, Aut(S3) = Int(S3) = B(Aut(S3)) = Sa. 


»> Détermination des groupes d’ordre 2p (où p premier impair) 


On choisit dans G un élément r d’ordre », et un élément s d’ordre 2. On a 
s < Tr > car 2 ne divise pas p. Avec < r > d'indice 2 dans G, on peut 
écrire: Gl<r>={<r>,s<r>k.G={br.;rp MU fs;sr.…..srp let 
G=<7r,s>. 


- Si Gest cyclique, G = Z/2pZ = Z/2Z x Z/pZ. 


- On suppose G non cyclique. Pour o #< r >, a s'écrit o = sr" (avec 
OSk<p—1). Si o? Z 1, alors a? = (sr*s)r = (srks l\r$ et avec < r > 
distingué, on à o? = r° avec 1 < à & p — 1. Avec p = 2q + 1, on écrit : 
024 = oP-1 = y donc or =1,o€e<r >. Contradiction. 


? Action naturelle de Aut(S3) sur T = {(1,2); (1,3); (2, 3)}. 
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Bilan : Vo #<r > ao? = 1. En particulier, (sr)? — 1 et on reconnaît le 
groupe diédral d'indice p. 


On a montré : 


Propriété 2.40 Un groupe d'ordre 2p (où p est un nombre premier impair) 
est soit isomorphe à Z/2pZ (donc aussi à Z/27Z, x Z/pZ, et donc commutatif ), 
soit isomorphe à D, (et dans ce cas il n’est pas commutatif). 


Remarque : Le groupe D, est un groupe non cyclique dont tous les sous- 
groupes propres sont cycliques. 


» Sous-groupe d’indice 2 et unicité 


Propriété 2.41 Soit G un groupe fini et H un sous-groupe distingué de G 
d'ordre m. On suppose que : mA[G : H] = 1. Alors H est l'unique sous- 
groupe (distingué) de G d'ordre m. 


Preuve : On note II le morphisme surjectif x + 7 de G sur G/H. Si K désigne 
un sous-groupe de G d’ordre m, on envisage la restriction de IT à X, qu’on 
continue à noter II. Puisque II(X) est un sous-groupe de G/H, o(II(K)) divise 
[G : H]. Par ailleurs, puisque KX/ker (Il) = H(X), o(I(K)) divise o(K) = m. 
Or mA[G : H] = 1, donc o(H(KX)) = 1, H(X) = {H}, K C H, et finalement 
K =H.… 


Remarque : Peut-on se passer de l'hypothèse "H distingué" dans la pro- 
priété 2.41? Non, dans $3 de cardinal 2 X 3, considérer les sous-groupes 
< (1,2) > et < (2,3) > qui sont d'ordre 2. 


Conséquences : a) On retrouve le fait que V4 distingué dans A4 est l’unique 
sous-groupe de 441 d’ordre 4. 


B) Si m est un entier naturel impair, alors le sous-groupe < r > des rotations 
du groupe diédral D,, = < r,s > d'indice m est l’unique sous-groupe de D 
d'indice 2. 


2.8.6 Cas général 


Propriété 2.42 (Théorème de Cauchy) Soit G un groupe fini d'ordre n 
et p un diviseur premier de n. Alors G possède un élément d'ordre p. 


Preuve : [cf. [4]] On raisonne par récurrence sur l’ordre n de G. Sin = 2, c’est 
évident. On suppose la propriété vraie pour tout groupe d’ordre m < n. Soit p 
un diviseur premier de n. Si G est commutatif, c’est acquis (propriété 2.33). 
On suppose donc désormais : Z(G) £ G. 
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- S'il existe x € G \ Z(G) tel que p | o(C;), on applique à bon droit l’hypo- 
thèse de récurrence à C3 (x € Z(G) = Cr G G) : il existe dans C4 (et donc 
dans G) un élément d’ordre p. 

- Si pour tout x € G\Z(G) p ne divise pas o(C;), p (premier) qui divise 
n = 0(Cxr) x [G : Cr], divise [G : C>] et d’après l'équation aux classes, p divise 
o(Z(G)). D’après l'hypothèse de récurrence, Z(G) donc G possède alors un 
élément d’ordre p. = 


On peut montrer mieux : 


Propriété 2.43 Soit G un groupe fini de cardinal n et p un nombre premier. 
Si p” | n avec me N, alors G contient un sous-groupe d'ordre p”. 


Application 2.2 Soit G un groupe fini et p > O0 un nombre premier. Les deux 
propriétés suivantes sont équivalentes : 

(1) o(G) est une puissance de p (i.e. G est un p-groupe). 

(2) Tout élément de G a pour ordre une puissance de p. 


Preuve : (1) = (2) est une conséquence immédiate du théorème de Lagrange. 
On suppose maintenant que l’ordre de tout élément de G est une puissance 
de p. Soit q un diviseur premier de o(G). Avec Cauchy, G possède un élément 
d'ordre q, donc gq s'écrit p*, et puisque gq est premier, q = p. D'où le résultat. m 


Application 2.3 Il n'y a qu’un seul sous-groupe d'ordre 15, à savoir Z/15Z. 


Preuve : Avec Cauchy, on choisit un élément a d’ordre 5, et un élément b 
d'ordre 3. Puisque 3 est le plus petit diviseur premier de l’ordre de G, le 
sous-groupe < a > est distingué dans G (propriété 2.14 p. 63). 

Ainsi, b- lab = bab = a, ou b?ab = a?, ou b?ab = a, ou b?ab = a. 


- Si b?ab = a, alors ab — ba et puisque o(a) A o(b) = 1, ab est d'ordre 
5 x 3 = 15: Gest isomorphe à Z/15Z. 


- Si b'ab = a?, alors (b2ab)° = a, encore b?a°b = a. Par ailleurs, b?ab = &? 
donne ba?b? = a. Ainsi, b?a°b — ba?b?, a — b?a?b, puis (a)? — b?ab, c-à-d 
a = b'atb. Il vient b? ab = b?a%b, a? = a, a = 1, ce qui est faux. 

- Si b'ab = a, alors (b? ab) = a$ = à, encore b?a°b = a. Par ailleurs, 
b?ab = a donne ba°b? = a. Ainsi, b?a?b = baÿb?, b*a?b = a°b?, ba?b = aÿb?, 
ba?b? — a, puis (a5)? — a — ba“b?. Il vient ba*b? — bab?, a — aÿ, a — 1, ce 
qui est faux. 

- Si b'ab = a“, alors (b?ab)* = batb = a. Par ailleurs, b?ab — a* donne 
a = ba*b?. Ainsi, b2a*b = batb?, ab = b?ab?, a*b? = b?a{. Or at (comme a) 
est d'ordre 5 et b? (comme b) est d'ordre 3. Il vient o(a4b?) — 15, puis G 
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cyclique. Le groupe Gest donc commutatif, donc b?ab = à, a? = a, ce qui est 
faux. = 


Application 2.4 {avec le concours de Michel Vieumelen) 

Soit p > 2 un nombre premier et G un groupe d'ordre p + 1. On note Aut(G) 
le groupe des automorphismes de G. Le nombre p divise l’ordre de Aut(@) si, 
et seulement si, il existe n > 1 tel que G © (Z/2Z)". 


Preuve : e Si p premier divise l’ordre de Aut(G), d’après Cauchy, le groupe 
Aut(G) possède un élément 4 d’ordre p. On pose F =< 4 >. 


Sur X = G\{1}, on considère alors la relation d’équivalence * : 


aTy & 20S<k<p—-1 v'(x) =. 


Pour x € X, on pose l'; = {ÿ € T'; (x) = x}. On vérifie que l; est un 
sous-groupe de F, donc l; = {Id}, ou l; = F. Si pour tout x Ee X, l; =}, 
alors 

VrexX VbeT vd(x)=7x, 
donc 6 = Id. Contradiction. Aïnsi 


EX T,={Id}. 


Les p éléments a, g(a), …, @P-1l(a) sont alors distincts dans X. G étant d'ordre 
pair, X possède un élément b = w/{a) d’ordre 2. Pour x quelconque dans X, 
æ s'écrit æ = @*(a) = p*—{(b). On a alors x? = p*-{(b?) — 1, ce qui assure 
que tout élément de G est involutif et prouve que G = (Z/2Z)" (on pourra 
reprendre la preuve ci-dessus en utilisant le langage éclairant des actions de 
groupes). 

e Pour la réciproque, on remarque que Aut((Z/2Z)") = GL,(Z/2Z) possède 
(27 — 1)(27 — 2)...(27 — 2-1) éléments (lemme 2.11 p. 82), donc on a bien 


p=2"—1|o(Aut((Z/2Z)")).m 
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$ Action naturelle de < @ > sur X. 


Chapitre 3 


Introduction aux espaces 
projectifs 


Introduction aux espaces projectifs, preuves des théorèmes de 
Pappus et de Desargues, dualité. 


(Dany-Jack Mercier!) 


Résumé : Voici une introduction aux espaces projectifs. Après 
avoir rendu compte du lien intime qui existe entre les espaces affines 
et les espaces projectifs, on définit une topologie sur le projectif, 
puis on justifie l'emploi de ces espaces en montrant que ce cadre 
de travail simplifie les démonstrations des théorèmes de Pappus 
et de Desargues en nous évitant d’avoir à envisager les nombreux 
cas particuliers qui apparaissent très vite en géométrie affine. On 
achève cette incursion projective en montrant comment la dualité 
permet de déduire mécaniquement des énoncés de théorèmes, et en 
nous intéressant aux homographies. Le lecteur qui désire atteindre 
rapidement les preuves des théorèmes de Pappus et Desargues peut 
sauter la Section 3.6. 

Cet article convient parfaitement pour découvrir les espaces pro- 
jectifs. Il devrait aussi permettre aux candidats aux CAPES et aux 
agrégations de prendre du recul en leur donnant l’occasion de : 

- mettre en oeuvre des résultats vectoriels classiques, 

- compléter une culture mathématique générale, 

- mieux comprendre deux jolis théorèmes dans des environne- 
ments géométriques différents. 


ICRREF, IREM de Guadeloupe, dany-jack.mercier@univ-ag.fr. 
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3.1 Introduction 


> Dans un plan affine, deux droites peuvent de pas se couper. Cela nous 
oblige à envisager de nombreux cas particuliers qui alourdissent les démons- 
trations. 


» Dans un espace affine de dimension finie sur un corps commutatif K, 
la dimension de l’espace affine Af (FU G) engendré par la réunion de deux 
sous-espaces affines est facile à calculer, mais nécessite d'envisager deux cas. 
Notons F = A+ Fet G=B+G, et utilisons le Th. 7 de [1]. 


-S ABE F + G, alors FNAGZGS, FNG est un sous-espace affine de 
—  — —  — —  — 
direction FN G,et AF(F U G) est de direction Vect( FU G) = F + G.On 
obtient 


EE 
dim(F+G) 

_ _ 
dim F +dimG-dim(FNnG) 
dim F + dimG — dim(FNG). 


dim (Af (FUG)) 


> — 2 


dim(AFf(FUG)) = dim(F +@+KAË) 
dim(F + G)+1 
_ _ = 
dim F + dimG-dim(FNnG)+1 


— 


= dimF+dimG-dim(F Nn G)+1. 


| 


La formule dim (A (FU G)) = dim F + dimG — dim(Æ NG) n’est pas tou- 
jours vraie. Peut-on imaginer un espace ressemblant fondamentalement à un 


espace affine, mais où deux sous-espaces s’interceptent toujours ? (réponse au 
Théorème 3.3) 


> La FIG. 3.1 représente deux droites sécantes D et D', ainsi qu’un point À 
n’appartenant ni à D, ni à D’. 
La fonction f qui à tout point M de D associe l’éventuel point N de D' tel que 
M, À, N soient alignés, n’est pas définie sur tout D. Le point Mo, intersection 
de D et de la parallèle à D’ passant par À, n’a pas d’image, tandis que le 
point No, intersection de D’ et de la parallèle à D passant par À, n’a pas 
d’antécédent. 
À cause des points Mo et No, la fonction f : D — D’ n’est ni une application, 
ni une surjection. 
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FIG. 31-f: Mi N 


Pour traiter cette pathologie, l’idée consiste à adjoïindre un nouveau point à 
chacune des droites D et D’. Ces points, dits ” points à l’infini” et notés cop 
et cop», appartiendront à n’importe quelle droite ayant la même direction 
que D ou D’. Il suffit alors de poser f (op) = No et f (Mo) = op» pour 
que l'application f : D U {oop} — D'U {ooy»} soit bien définie et bijective. 
Une "droite" ne peut-elle pas être considérée comme une droite affine stan- 
dard D augmentée d’un point à l'infini qui caractérise sa direction (le fameux 
point op) ? 


> C’est l'ingénieur militaire français Girard Desargues? (1591-1661) qui le 
premier définit le plan projectif comme un plan "usuel" auquel on rajoute des 
points à l’infini correspondant, chaque fois, à des directions de droites, deux 
droites parallèles se coupant alors toujours en un point à l'infini. 
Si D est une droite du plan usuel E,, et si l’on note œp sa "direction", le plan 
projectif P(E) est l’ensemble 


P(E)=EUDs 


où Dx = {op /D droite de E} représente la "droite à l'infini" (formée de 
tous les points "à l'infini"). 

La FIG. 3.2 montre comment on peut imaginer un plan projectif : l’inté- 
rieur (strict) du disque que l’on a dessiné représente le plan affine usuel, et ce 
disque est donc, en fait, de diamètre "infini". Des droites de même direction 


?Cet ingénieur continua les travaux des grecs Apollonius de Perge (3ème s. av. J.-C.), 
Ménélaüs d'Alexandrie (ler s. ap. J.-C.) et Pappus d'Alexandrie (4ème s. ap. J.-C.) sur 
les sections coniques (intersections d’un cône et d’un plan) et les problèmes de perspective 
(par projection centrale). Les théorèmes affines qui portent son nom s’énoncent d’une seule 
manière si l’on se place dans le plan projectif. 
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Droite à l'infini 


Ne 


// 


F1G. 3.2 — Une représentation du plan projectif 


définissent un unique point op situé sur le demi-cercle supérieur F (ouvert à 
gauche, fermé à droite) dessiné sur la frontière du disque. Ce point, qui caracté- 
rise toutes les droites possédant une direction commune, appartient à chacune 
d’elles. Maintenant, deux droites parallèles et distinctes D et D’ se couperont 
toujours en un point np que l’on dit être "à l’infini". Le demi-cercle [' formé 
de tous les points à l’infini est naturellement appelé droiïte à l’infini. 

Dans la Section suivante, nous allons proposer une définition plus générale 
et plus rigoureuse d’un espace projectif, mais la visualisation précédente doit 
accompagner notre incursion dans le domaine projectif. C’est elle qui nous per- 
met "d'imaginer" notre plan affine comme "baignant" dans un plan projectif 
obtenu en rajoutant une nouvelle droite (la droite à l'infini). 


3.2 Définitions 
Dans toute la suite, K désigne un corps commutatif. 


Définition 3.1 Soit E un espace vectoriel de dimension fini sur K. L’espace 
projectif associé à E est l’ensemble quotient de E\ {0} par la relation d’équi- 
valence 


zRy & IE K* x = AY. 
On le note P(E), de sorte que P(E) = (E\{0})/R. 
La classe d'équivalence x de x € E\ {0} suivant R est la droite Vect (x) engen- 


drée par x privée du vecteur nul. La surjection canonique p : E\ {0} — P(E) 
est l’application qui à un vecteur non nul x de E associe sa classe x suivant 
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la relation R. On confondra pratiquement cette surjection canonique avec la 
fonction p : E — P(E) qui reste surjective, tout en n'étant plus définie sur E 
tout entier. 


Comme nous l’avons noté, chaque classe x de P(E) représente une droite 
de Æ privée du vecteur nul. L'espace projectif P(Æ) est donc en bijection 
naturelle avec l’ensemble des droites vectorielles de E, autrement dit avec la 
grassmannienne Gg1 de dimension 1 de E (on appelle grassmannienne de 
dimension m de E, et l’on note GEm, l'ensemble des sous-espaces vectoriels 
de dimension m de E). 

On peut écrire 


P(E) = Gp:1. 


Définition 3.2 La dimension de P(E) est dimP(ÆE) = dimE —1. On dit 
que P(E) est une droite (resp. un plan) projectif si dimP(ÆE) = 1 (resp. 2). 
Sin € N*, l’ensemble P(K"*1) est appelé espace projectif standard de 
dimension n sur K. On le note indifféremment P° = P'(K) = P(K"+1) 
si aucune confusion est possible. Un espace projectif est dit réel si K =R, 
complexe si K = C. Si F est un sous-espace vectoriel de E, l’ensemble 
F=nmF) est appelé sous-espace projectif de P(E) associé à F'. On pose 
alors dim F = dim F — 1. 


pt T2 . . . . & = 
> p(F) —=P(F) est bien l’espace projectif associé à F. 
— 
» Poser dim F = dim F — 1 est agréable, car correspond à notre intuition. 
— 
En effet, si F' est une droite vectorielle, F = p(F') est un singleton auquel on 
— 
attribue la dimension dim F' — 1 = 0, ce qui nous convient parfaitement ! 
Convention : L'ensemble vide peut être considéré comme un sous-espace 
projectif de P(E) associé au sous-espace vectoriel {0}. Après tout, p est une 


fonction de E sur P(E) (définie sur Æ\ {0}) et p({0}) = &. La dimension de 
l’ensemble vide est alors dim @ = dim {0} — 1 = —1. 


3.3 Propriétés 


Théorème 3.1 Une intersection (\,-, F; de sous-espaces projectifs F; asso- 


ciés à des sous-espaces vectoriels F; est un sous-espace projectif associé à 
— 
Pier Fi. 


— — 

Preuve : Si F; = p(F;) pour tout à € I, où les F; représentent des sous-espaces 
— — 

vectoriels de E, alors fer Fi = [er (Fi) = per Fi). En effet, si l'inclusion 


100 CHAPITRE 3. INTRODUCTION AUX ESPACES PROJECTIFS 


— — 
er P(Fi) D p([ er Fi) est toujours vraie, on remarque que, réciproquement, 
ic \ her 

si M € er p(Fi), alors 


Viel 2x, € F;\ {0} Mep(é) 


de sorte que pour n'importe quels indices à et j, M = p(x;) = p(x;). Ainsi 


Vi £j 11 € K* Tj = ÀT. 


— 
Si l’on fixe l'indice j, on peut maintenant affirmer que x; € fc, F;, et donc 
— 
que M = p(x;) € p([hier Fi). 0 
La stabilité des sous-espaces projectifs par intersection permet de définir le 


sous-espace projectif engendré par une partie À de P(E). C’est, par 
définition, l'intersection 
NF 


F's.e.p. 
FSA 


de tous les sous-espaces projectifs contenant À, ensemble que l’on note Proj (À). 
Bien entendu, Proj (A) est le plus petit sous-espace projectif de P(E) conte- 
nant À (pour la relation d’ordre C dans P(E)). 


Théorème 3.2 Si À C P(Æ), le sous-espace projectif engendré par À est 
associé au sous-espace vectoriel engendré par pr (A). Autrement dit 


Proj (A) = p (Vect (p”! (A))). 


_— 

Preuve : Si F — p(F) est un sous-espace projectif qui contient À, on à 

— — 

F=pt(F)U{0}>p !(4). Réciproquement, tout sous-espace vectoriel F 
— — 


de E tel que F° > pl (A) définit un sous-espace projectif P = p(F') tel que 
F > A. Aïnsi 


Proj(4)= (F= (ao(r) = p( ( F)=p(Vect(p-!(4))).n 
F's.e.p. F s.e.v. F s.e.v. 
F3A  F>p1(4) F5p71(4) 


Théorème 3.3 (Théorème des dimensions) 
1) Si F et G sont deux sous-espaces projectifs de P(E), 
dim (Proj (FU G)) = dimF +dimG -— dim(FnNnG). 


2) En particulier, si dim F + dimG > dimP(Æ), l'intersection F NG n’est 
pas vide, et deux droites du plan projectif sont toujours sécantes. 
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— — 
Preuve : 1) Si F et G sont associés aux sous-espaces vectoriels F et G, 


10 
dim(Proj(FUG)) = dim(F+G)-1 
_ _ — 
= dimF+dmG-dim(FNnG)-1 
dim F+dimG-dim(FnG). 


2) Si dim F + dimG > dimP(Æ), la formule entraîne dim (FN G) > 0 d’où 
FNG £ ©. Enfin deux droites D et D’ du plan projectif sont de dimension 1, 
donc vérifient dim D + dim D’ > 2. L'intersection D N D' n’est donc jamais 
vide : ce sera le sous-espace projectif associé à D N D’. 


3.4 Coordonnées homogènes 


3.4.1 Définitions 


Définition 3.3 Soit e — (eo, .…,en) une base de l’espace vectoriel E. Les co- 
ordonnées homogènes d’un point M de P(E) relativement à cette base sont, 
par définition, les coordonnées d’un des vecteurs x tel que p(x) = M dans la 
base e. De telles coordonnées sont définies à un coefficient multiplicatif non 
nul près. On note (to : Æ1 : … : Æn) un tel système de coordonnées homogènes 
de M. Ainsi 


Mr res er = pO me). 
i=0 


Définition 3.4 Les points Po, P1, .…, P, de P(E) sont projectivement in- 
dépendants s'ils proviennent de vecteurs linéairement indépendants. On dit 
alors aussi que la famille (Po, P1,.…., P,) est projectivement libre. 


Définition 3.5 On suppose dimP(E) — n. Un repère projectif de P(E) 
est la donnée d’une (n + 2)-liste (Po, P1,.…., Ph+1) de points de P(E) tels qu'il 
existe une base e = (ep, .…,en) de E avec 

IVe f0L:Lnr. Pen) =(0rsr 00250) «fé L-ést a 
i-ième place), 

2) Pécresse 
Les P5, P1,.…, Ph sont les points base, et P,+1 est le point unité. 


La donnée d’un repère projectif (P6, P1,.…., Pn+1) de P(E) permet de recons- 
tituer très précisément une base e de E et d'introduire les coordonnées ho- 
mogènes d’un point quelconque dans cette base (que l’on appellera coor- 
données homogènes dans le repère projectif). En effet, si e — (ep,.…,en) et 
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e" = (e,.….,e,) sont deux bases de Æ vérifiant les conditions de la définition 
précédente, pour tout à € {0,1,...,n}, 


P; = p(e;) = p (ei) & À EeK* e = ke, 


et 


nm n 


Pb = pO ei) = pO €) & ZE K* Ÿ ec = Ad 6 
i=0 i=0 


par conséquent À; — À pour tous les à € {0,1,...,n}. Les bases e/ et e sont 
proportionnelles, et l’on peut indifféremment choisir l’une ou l’autre pour dé- 
terminer les coordonnées homogènes d’un point du projectif : en effet, si M 
admet les coordonnées (x0 : 41 :.….: x,) dans e, il admettra les coordonnées 
(xo/X : x1/X:...: xn/À) dans e’, et l’on sait que des coordonnées homogènes 
proportionnelles définissent le même point projectif. 


Théorème 3.4 Une famille (Po, P1,.…., Ph+1) de n +2 points de l’espace pro- 
jectif P(E) est un repère projectif si et seulement si toute sous-famille de n+1 
points est projectivement libre (c’est-à-dire si aucun hyperplan ne contient n+1 
points parmi les Po, P1,.…, Pn+1). 


Preuve : La condition est nécessaire. Réciproquement, si les points P; = p(e;) 
sont donnés tels que n +1 vecteurs quelconques de la famille (e0,.…, en+1) sont 
linéairement indépendants, il s’agit de déterminer une base e/ = (ef, ….,e!) 
de Æ telle que 


Vie {0, 1: 0 Fi = p (ei) — p (ei) 
Pnr1 = p(en+1) = p(ep +.….+en). 


Autrement dit, il faut trouver des scalaires À et À; tels que e! = je; si0 <i<n 
et En+1 = À(e +.….+er). 

Le vecteur en+1 s'exprime dans la base (eo, …, en), disons par en+1 = D 0 éjei: 
et la condition à réaliser est 


die; = À (00 + … + Anen) 
i=0 
ou encore 
Vie{0,1,..,n} XX =é,. 


Il suffit de prendre À = 1 et À; = &; pour tout 0 < à < n. C’est possible 
puisqu’aucun des coefficients £; est nul (en effet, si &;, — 0 alors le système 
(eo, 1, .…., 0. En+1) est lié, ce qui est absurde). = 
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Ainsi : 
- Trois points À, B, C de la droite projective forment un repère projectif 
si, et seulement si, ils sont distincts deux à deux. 
- Quatre points À, B, C, D du plan projectif forment un repère projectif 
si et seulement si trois quelconques d’entre eux ne sont jamais alignés. 


Dans le plan projectif, une démonstration commence souvent par le choix 
d’un repère projectif "intéressant", bien adapté à la figure sur laquelle on 
travaille. Cela permet d'utiliser des équations de droites simples dans ce repère. 
Cette technique sera mise en oeuvre aux Sections 3.7 et 3.8 pour proposer des 
démonstrations "projectives" des Théorèmes de Pappus et de Desargues. 

Si l’un de nos buts est de travailler en projectif pour démontrer des résultats 
affines, il nous faut tout d’abord nous représenter un espace affine comme 
plongé" dans un espace projectif. Ce sera l’objet de la Section 3.5. 


3.4.2 Equations cartésiennes de sous-espaces projectifs 


> — 
Soit F = p(F') un sous-espace projectif associé au sous-espace vectoriel F'. 
De façon naturelle : 


Définition 3.6 On appelle système d’équations cartésiennes de F dans 
le repère projectif (Po, + Pat) = (p (eo), .…,p(en) ,PO 0 &)) tout sys- 
tème d'équations cartésiennes de F' dans la base (eo, .…, en). 


> Par exemple, une droite du plan projectif P? (K) est formée de tous les 
points de coordonnées homogènes (x : y : z) telles que 


ax + by + cz = 0 


où (a,b,c) € K%\{(0,0,0)}. On notera qu’une telle équation est homogène, ce 
qui est fort heureux puisque des coordonnées homogènes d’un point ne sont 
définies qu’à un coefficient multiplicatif non nul près. 


> Deux points distincts À et B du plan projectif P? (K) déterminent une 
droite que nous noterons (AB). Dans le repère projectif canonique de P?(K) 
(associé à la base canonique de X%), notons (ao : a : a2) et (bo : bi : b2) les 
coordonnées homogènes respectives de À et B. Notons aussi a et b des vecteurs 
de K* tels que À = p(a) et B = p(b). 
Un point M = px), de coordonnées homogènes (x0 : 1 : &2), appartient à 
la droite (AB) si et seulement si le vecteur x appartient au plan vectoriel 
Vect (a, b) engendré par les vecteurs a et b. On peut donc écrire 


To @o bo 
M E (AB) & ze Vect(a,b) & | æ1 a1 b1 | =0 
To G2 bo 
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et obtenir ainsi une équation de (AB). 


Cette description de la droite projective (AB) nous permet d’énoncer : 


Théorème 3.5 Soient À, B, C, D quatre points du plan projectif P? (K), de 
coordonnées homogènes respectives (ao : ai : a2), (bo : b1 : b2), (co : €1 : c2) et 
(do : di : d2). Les propriétés suivantes sont équivalentes : 
i) (A, B,C, D) est un repère projectif de P? (K), 
ii) Trois points parmi À, B, C, D ne sont jamais alignés, 
ii) Aucun mineur (i.e. déterminant d’une matrice extraite) d’ordre trois 
extrait de la matrice 
ao bo Co do 
aj O1 € di 
a2 Da C2 d2 


n’est nul. 


3.5 Lien affine-projectif 


3.5.1 Les complémentaires d’hyperplans projectifs 


Soit P? — P(K"+1) l’espace projectif standard de dimension n sur X. 

Si x € P”, notons x = (xo : t1 : … : &n) les coordonnées homogènes de x dans 
la base canonique de K"*1, Soit H; l’hyperplan d’équation x; = 0 dans P” et 
A; = P"\H; le complémentaire de cet hyperplan. On à 


DEA 2 = tnEtie tn avec 0 
Bw - À 
ER —) 


(où le 1 est à la i-ème position, 0 < à < n). On peut donc définir la bijection 


f: K" _ A 
Cost ES ns sels to 


où le chapeau au-dessus de x; signifie que x; est absent. La bijection réciproque 
Mectse 
s'écrit 


fe : À ais K° 
To T1 Ti z 
oies) d (=, 3). 
Li Li T; T; 


Théorème 3.6 L'ensemble A; est structuré en espace affine par transport de 
la structure affine de l’espace vectoriel K”. 
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Preuve : Rappelons qu’un ensemble E est structuré en espace affine sur K 
_— 
s’il existe un espace vectoriel E sur K ainsi qu’une application 


vw: EX EE JE 
(Mu) + M+% 
telle que : 
_— 
A1 VMEE Vu,veË (M+u)+v=-M+(x+%), 
A2 Pour tout M € E,, l'application 
_— 
Ou: E — E 
+ M+vu 
est bijective ([1], Définition 4)). 
On peut vérifier que les conditions A1 et A2 entraînent M + D =M pour 
tout M, de sorte que dire que Æ est un espace affine revient à dire que le 
groupe additif (Æ', +) d’un espace vectoriel opère simplement et transitivement 
sur E. Avec cette définition, il est facile de voir que l’espace vectoriel K”7 est 


canoniquement structuré en espace affine par l’application &(x,y) = x +y 
(addition dans l’espace vectoriel K”). 


Le transport de structure de K” vers À; se matérialise lorsqu'on définit l’appli- 


cation 
D : À; x K7 —> À; 


(a,x) + a+tz=fi(f (a)+x), 

et que l’on vérifie que w satisfait les axiomes A1 et A2. 

e A1. 4 définit une opération de groupe car, pour tout a € À; et pour tous 
x,y € K7, 

(a+z)+y = ff (a+a)+y) = HF 0 fi (fr (a) ++) +y) 
= fi(f(a)+x+y) =a+(x+y), 

et a +0 = a. 

e A2. Cette opération est simplement transitive, autrement dit si a, b € À; 


il existe un et un seul vecteur x € K” tel que a + x = b. En effet, 


atz=be fi(flt(a)+x) =b & x=f;t(b)- fr l'(a).m 


t 


Visualisation : Si 4! désigne l’hyperplan affine de K"*1 d’équation x; — 1, 
la bijection 


Gi : À; = À; 
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F1G. 3.3 — Visualisation d’une partie "affine" du plan projectif. 


est le pendant naturel de la bijection f; : K° — 4;, et permet aussi de définir 
la structure affine sur À;. 

La FIG. 3.3 permet de visualiser la situation lorsque n = 2. Elle montre deux 
représentants a et b (de cotes z2 = 1 dans K%) de deux points distincts à, b 
de A2 = P?\H, appartenant à l’hyperplan affine 4, de KŸ d’équation x2 = 1, 
liés par la relation a + w = b. 

En effet, chaque point à de A2 est identifié à un vecteur a de l’hyperplan 
affine 4!,, et l’action du groupe additif (K?,+) de l’espace vectoriel K? sur A2 
est donnée par 


Va=(a:a:1)Ee A2 Vu =(a,B)eK? a+uw={(aota:a+B:l). 
Voici quelques conséquences du Théorème 3.6 : 


Corollaire 3.1 L'espace P" est une variété différentielle de dimension n et 
de classe C®. 


Preuve : Les ensembles À; recouvrent P” et la famille {(4;, f; Docien est un 
atlas C'© de P”. Les cartes sont les couples (A;, fe): et les changements de 
cartes fi; — £ o f; sont de classe C®. Si j > à, on obtient : 


fi 
Fra) ANA; ca fr (AN A;) 
1; en n 
Dose Dés sas Mn Vu (Do ont lé as) ue ir das 2). m 
. J : 
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On dit que les ensembles À; (on devrait dire : les couples (A;, de) sont des 
cartes affines de P”. Tout point du projectif appartient à au moins l’une de 
ces cartes, si bien que, localement, un espace projectif est un espace affine. 


Corollaire 3.2 Le complémentaire d’un hyperplan dans un espace projectif 
de dimension n est un espace affine de dimension n. 


Preuve : Il suffit de choisir des coordonnées homogènes sur P* bien adaptées 
à l’hyperplan projectif H, c’est-à-dire telles que À admette une équation de 
la forme x; = 0, et utiliser le Théorème 3.6. m 


Corollaire 3.3 Tout espace affine E de dimension finie peut être plongé dans 
un espace projectif de même dimension. Il est alors isomorphe au complémen- 
taire d’un hyperplan projectif. 


Preuve : Si E est un espace affine de dimension n, il est isomorphe à X” par 
le choix d’un repère affine, puis en bijection avec l’une des parties À; = P?\AH; 
via l’application f; : K7? — À;.m 


Définition 3.7 Si le plongement est noté f; : E © K" = À;, les éléments de 
H; = P”\A; sont appelés points à l’infini de E. L’hyperplan H; est appelé 
hyperplan à l’infini de À;, et parfois noté A. Bien entendu : 


PIX) = 4] | Hi = 4;| | 48. 


Sur la FIG. 3.4 (où n — 2), la droite bleue D est dessinée dans le plan affine À’. 
La droite rouge D.- est le point à l’infini sur D, et la droite projective complète 
(ab) est la réunion : (ab) = D| {Ds}. On voit que les points à l'infini du plan 
affine 4’ d’équation x2 = 1 sont les différentes directions des droites de 4. Si 
l'on identifie 4! à A2 et à K?, alors 


A, = A2 = K° C P(K$) 
et l’on peut écrire P(K*) = 4; | |P(4;), ou encore P(KŸ) = K?|]P(K?), 
puisque P (4;) est l’ensemble des droites de A. 


Le plan projectif P(KŸ) peut ainsi être considéré comme la réunion 
disjointe du plan affine X? et de l’ensemble de toutes les directions 
des droites de K?. 


Nous retrouvons la description donnée dans l’introduction, à la Section 3.1. 


108 CHAPITRE 3. INTRODUCTION AUX ESPACES PROJECTIFS 


F1G. 3.4 — Une droite affine et son point à l’infini 


3.5.2 Visualisation du plan projectif 


Penser au plan projectif, c’est penser à un plan affine qui a été complété par 
une "droite à l'infini". Reprenons les notations de la Section précédente, mais 
supposons ici que n — 2. On peut compléter la FIG. 3.3 en dessinant un 
repère projectif (O, 1,J, K) bien adapté à la carte affine A2, c’est-à-dire formé 
de quatre points projectifs qui appartiennent à l’espace affine A2, comme sur 
la FIG. 3.5. Le plus simple est de choisir les points ©, 1, J, K de coordonnées 
homogènes : 


OOEVEL)E FOSSES FOLDES Es lsD, 


En fait, on peut procéder différemment en considérant quatre points quel- 
conques ©, I, J, K de A2 tels que trois d’entre eux ne sont jamais alignés, 
rappeler qu’un tel système de points constitue un repère projectif de P(K%), 
puis utiliser des coordonnées homogènes dans ce repère de façon à avoir en- 
core (+). 


Chacun des points O, I, J, K possède des coordonnées homogènes, mais aussi 
des coordonnées affines puisqu'il s’agit de points de l’espace affine A2 que l’on 
peut rapporter au repère affine (O, J,.J). Les coordonnées affines des points O, 
I, J, K sont alors : 


O(O0z JLOYS JOIE KL}, 
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droiteà l'infini (PQ) »% 


F1G. 3.5 — Un repère projectif (O, 1, J, K) adapté au plan affine 42. 


où K est le point unitaire. 


Les points P,k et Qx de coordonnées homogènes respectives (1 : 0 : 0) et 
(0:1:0) n’appartiennent pas à À;, mais plutôt à l’hyperplan à l'infini H 
d’équation x2 = 0. Ici, on parlera plutôt de "droite à l’infini" puisque n = 2 
entraîne dim H2 = n — 1 = 1. On notera H2 = (PLkQ+) cette droite. 

Les points PL et Q n’appartiennent pas à l’espace affine A», mais il peut 
être évocateur (et assez tentant) de leur trouver des coordonnées affines dans 
le plan 42. Que pourrions-nous alors proposer ? 


Compte tenu de l'identification de A2 à K? donné par pe (à la Sec- 
tion 3.5.1), il est raisonnable (?) de dire que P, (1 : 0 : 0) correspond à un 
point affine de A2 dont les coordonnées dans le repère affine (O,7,.J) sont 
(à 5). Hum, disons que à — © et que Û = 0, et l’on pourra dire que les 
coordonnées affines de P,. sont (00,0). C’est abusif, mais c’est parlant ! 


De même, on peut imaginer que les coordonnées affines de Q sont (0, co). 


Cela ne nous mène malheureusement pas bien loin car nous serions incapable 
de proposer des coordonnées affines "décentes"' aux autres points de la droite 
PxQ%), à moins de proposer (00,%), ce qui serait un combleÿ. 
2 


En regardant la FIG. 3.5, il est tout de même agréable de penser que les 
trois points O, Î, J formant un repère affine de 42, le point unitaire K qui 
complète les trois points précédents pour en faire un repère projectif de P(KŸ), 
et les points P,, Q qui déterminent la droite à l’infini de l’hyperplan 42, ont 
des coordonnées homogènes dans P(X), et des coordonnées affines dans A2 
(avec l’abus signalé pour Py et Q&) donnée par le tableau (T°) ci-dessous. 


Une infinité de points de (PkQ) auraient alors les mêmes coordonnées ! 
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| Points | Coordonnées homogènes | Coordonnées affines 
| O (OO 1) (0, 0) 
[LT (ES00 (1,0) 
J (0-31) (0,1) 
K (:1:1) (1,1) 
PS (1:0:0) (co, 0) 
0 (0:1:0) (0, co) 


Tableau (T) 


On peut encore utiliser la FIG. 3.5 pour visualiser des droites parallèles de 
l’espace affine A2 qui se coupent en un point de la droite à l'infini (PQ). 
On obtient la FIG. 3.6 où l’on a dessiné trois droites parallèles du plan affine 
qui se coupent (et coupent la droite à l'infini) en M. 

Vérifions-cela. De façon générale, toute droite affine D. de A2 de vecteur di- 
recteur donné w (—b, a) admet une équation de la forme 


D, : ato + bx1 +c—=0 


(avec (a,b,c) € K et (a,b) Æ (0,0)) dans le repère affine (O, 7, J). 
Compte tenu du plongement de A2 dans P(KŸ), l'équation de l’unique droite 
projective D. de P(KŸ) qui contienne D, sera 


D, : axo + dt + cr = 0. 


Autrement dit, De est l’ensemble des points du projectif de coordonnées ho- 
mogènes (0 : 1 : T2) vérifiant axo + br + era — 0, et D.N A2 = D. Il s’agit 
maintenant de déterminer l'intersection D. (PQ). Si M est de coordon- 
nées homogènes (a : 5 : y), alors M appartient à DN(PxkQ) si et seulement 
à aa + bB + cy =0 

le 
c’est-à-dire 


et l’on peut affirmer que De. N(PxQs) = {M} où M (-b : a : 0). 
Cela nous montre deux choses : 


- que des droites affines de 42 parallèles entre elles se coupent toujours en 
un seul point sur la droite à l'infini (PQ), 
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- que deux droites distinctes quelconques du projectif se coupent toujours 
en un point”. 


La FIG. 3.6 essaie de rendre compte de ce phénomène. On notera que, sur 
cette figure (comme sur la FIG. 3.5) la droite à l'infini (P.Q%) est indûment 
représentée par un cercle, alors qu’on devrait plutôt dessiner un demi-cercle. 
Mais on peut s'affranchir de cela en imaginant qu’un point de (PL, Q+) est 
représenté par deux points diamétralement opposés sur ce cercle. 


droite à l'infini (PQ) % 


F1G. 3.6 - Droites parallèles de A2 se coupant sur la droite à l’infini. 


Une dernière remarque pour terminer cette Section. Nous avons-vu qu'il était 
toujours possible de choisir un bon repère projectif (O, I,J, K) pour lequel 
la carte affine A2 admet le repère affine (O,7,J), et qu’il suffisait de choisir 
quatre points de 42 tels que trois d’entre eux ne sont jamais alignés. 

Mais étant donné deux points À et B de P(KŸ), est-il toujours possible de 
trouver un repère projectif (O,1,J, K) pour lequel À et B sont des points "à 
Pinfini", ce qui signifierait que, pour le choix d’un tel repère, la droite (AB) 
serait tout bonnement la droite à l'infini (PQ) dont nous avons parlé plus 
haut ? 

La réponse est affirmative, puisqu'il suffit de considérer que (AB) est la droite 
d’équation x2 = 0, puis de choisir un repère projectif (O,1,J, K) formé de 
quatre points appartenant à A2 = P(KŸ)\ (AB), pour répondre à nos attentes. 
On dit que l’on a envoyé les points À et B à l'infini, ce qui sous-entend que 
l’on va s'intéresser aux points qui n’appartiennent pas à la droite (AB) et les 
considérer comme étant des points d’un espace affine où l’on peut dessiner, 
interpréter des configurations, etc. 


Nous le savions déjà : voir Théorème 3.3. 


112 CHAPITRE 3. INTRODUCTION AUX ESPACES PROJECTIFS 


3.5.3 Visualisation dans le cas général 


On reprend exactement le travail de la section précédente en nous plaçant 
cette fois-ci dans l’espace projectif P(K”+*1) de dimension n. La carte affine 
An = P(K"#1)\H, où H, désigne l’hyperplan projectif d’équation 7h = 0, est 
mise en valeur si l’on choisit un repère projectif 


R=(O, 1, ln K) 


formé de points de À (tels que n + 1 quelconques d’entre eux n’appartiennent 
pas à un même hyperplan). Le bon choix est sans doute de prendre : 


O—=(0:0%2: 707071) 
= (10:20:01) = {(e) 


SER 
Il 
OP 
mn 
HS 
nt 
M 
FR 
à 
Î 
S 
RSR 
D OQ 
O 3 
LR 
+ 
Q 
à 
nr 


On ne s’en privera pas dans la suite. 
Dans l’écriture ci-dessus : 


- on a identifié les points de P(K"*1) avec leurs coordonnées homogènes 
dans R. 


- p désigne la surjection canonique définie à la Section 3.2. 
- le système (eo, …, en) désigne une base de X"*1 associée au repère pro- 


jectif R au sens de la Définition 3.5. On prendra bien garde de noter que 
(eo, …., en) n’est pas la base canonique de K"*t, 


Avec ce choix, R; = (O,1:1,..,1,) est un repère affine de À (muni de sa 
structure canonique d’espace affine de dimension n), et les coordonnées affines 


de l’origine © et des sommets /1, …, 1, de ce repère sont données dans le 
tableau (T,) : 


Points Coordonnées homogènes Coordonnées affines 
dans R dans R, 
O 00 
oh 
In 
K 


Tableau (T;,) 
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3.6 Topologie sur P(E) 


Soient n un entier naturel non nul, et Æ un espace préhilbertien de dimension 
finie n+1 sur le corps X (où À = R ou €). La norme de E est notée || || et l’on 
pose U = {2€ K/]|2|] = 1}. On note P(E) l’espace projectif (de dimension n) 
associé à E, et p : E — P(E) la surjection canonique qui à un vecteur non nul 
associe la droite qu’il dirige. 


3.6.1 Une distance sur P(F) 


Théorème 3.7 Si x,y € P(E), et si u, v désignent des vecteurs normés de 
E tels que x = p(u) et y = p(y), l'application d': P(E) XP(E) —R, qui au 
couple (x,y) associe le réel d(x,y) = Min( jeuz [Au — uv|| est une distance 
sur P(E). 


Preuve : On remarque d’abord que : 

> Le nombre d(x,y) proposé est indépendant du choix du couple (u,v) tel 
que x = p(u) et y = p(y); 

> Le minimum existe bel et bien, puisque l’application (À, x) + || Au — uul|, 
continue sur le compact U?, atteint ses bornes sur ce compact. 


> d(x,y) = Minjeu [Au — v||. 
On vérifie ensuite les trois axiomes d’une distance : 

e Si d(x,y) = 0, en notant d(x,y) = || ou — yvl| où Ào et 9 sont des 
éléments de Ü, on obtient Aou — uov = 0, d’où x = y. 

e Pour tous x,y E P(E), d(x,y) = d(y,x). 

eSiz=p(w)eP(E), 


VAHEU Jul < [Au — wi] + [lu — wvl| 


donc 
VAUEU d(x,y)< [Au vw + [uw — uvl|. 


Pour y fixé, il suffit de passer à la borne inférieure pour À € U dans l’inégalité 
d(x,y) — |fw — pv] < [[ Au — w|| pour obtenir 


VuEU d(x,y) <d(x,z) + |lw — pi]. 


On passe ensuite à la borne inférieure dans d(x, y) —d(x,z) < |fw—yv|| pour 
a EU, pour obtenir d(x,y) < d(x,z) + d(z,y). 


Théorème 3.8 Muni de la distance d définie au Théorème 8.7, P(E) est un 
espace métrique compact et la surjection canonique p : E — P(E) est continue. 
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Preuve : L'application p : E — P(E) est lipschitzienne de rapport 1 puisque 


VuveE d(p(u),p(v)=, Min, [au - pol < [lu ul. 

(A H)EU? 
C’est donc une application continue. L’espace P (Æ) est compact comme l’image 
de la sphère (compacte) S(E) = {x € E/||x|| = 1} par l'application conti- 
nue ?. 


Puisqu’un espace métrique compact est nécessairement complet (on vérifiera 
en effet en exercice que toute suite de Cauchy qui possède au moins une valeur 
d’adhérence l est convergente vers {), on peut affirmer que P(E) est complet. 
E étant identifié à K”+1 par le choix d’une base, si x € P(E), on note 
æ = (0:21: :2n) les coordonnées homogènes de x dans cette base, A; 
l’hyperplan d’équation x; = 0 dans P(E) et À; = P(EÆ)\H; l’ouvert affine, 
complémentaire de H; dans P(F). 


Théorème 3.9 Les isomorphismes affines f; : K° — À; sont des homéomor- 
phismes, et {Ai};-0.… est un recouvrement de P(E) par des ouverts partout 
denses. 


n 


Preuve : > Montrons que l’application 


ji: 7 => A; =P(E)\H; 
(otre eee édit le.) 


est un homéomorphisme. Pour cela, décomposons f; en f; = p'oroqoù 
q: KP + . A = AN =) 
Ces) ee Giaer Lis ne) 
est une bijection bicontinue, 


Tr: A! _ AA 
y + y/|yll 


est une bijection bicontinue de A! sur SŸ = S"(K)N{(x0,.….,æn) /æi € RY}, 
où l’on pose S"(K) = {x € K"*1/||x|| = 1}, de bijection réciproque 


—l; + ! 
pr S; — À; 
TO Tn 
ess) ed 
Ti Ti 
et où p' = pls+ : SŸ — A; désigne la restriction (au départ et à l’arrivée) de 


la projection canonique p : E — P(E) à Si. 
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Puisque q et r sont déjà des bijections bicontinues, montrer que jf; est un 
homéomorphisme revient à montrer que p/ est une bijection bicontinue. 

On remarque tout d’abord que y’ est bijective et continue (comme restriction 
de lPapplication p, continue d’après le Théorème 3.8). Il reste seulement à 
vérifier que p/—! est continue, autrement dit p! est une application fermée 
(c'est-à-dire transforme tout fermé de °° en un fermé de À;). 

On remarque que l’ensemble de départ A est un sous-espace métrique du 
compact SŸ U 59 où S° = S"(K) N {(x0, T1, .…., Tn) / ti = 0} (l’adhérence 
de 5% est égale à S7 U SP). Tout fermé F'’ de SŸ est donc la trace d’un 
fermé F de SŸU S?, soit F’ = FN ST. Mais F, fermé dans un compact, est 
compact. On a 


p(F) =p(F)np(sf) =p(F)NnA;, 


et p(F") apparaît comme l'intersection de À; et du compact p(F) (image du 
compact F par p continue). p(F”) est donc, par définition, un fermé de À;. 


> Il est évident que la famille {4;},_6.., recouvre P(E). 


> Montrer que À; = P(E)\H; = P(E) \p(S9) est ouvert dans P (E) revient 
à prouver que p(SŸ) est fermé, ce qui n’est pas difficile puisque p(S?) est 
compact comme l’image du compact SŸ par l'application continue p. 


> Il reste à montrer que chaque ouvert À; est dense dans P(Æ). Pour cela, 
il s’agit de prouver que tous les points x = p(u) de P(E)\A; (où u € K"*1) 
appartiennent à l’adhérence de À;. Notons u = (x9,.….,%5-1,0,%;+1,...,%n) et 
définissons la suite (t»),en* PAT Tm = P(um) et 


1 
Um — (xo, cs Li]; mt ... di) 


pour tout m € N*. Puisque limu,, = u, la continuité de p montre que 
lim æm = limp(um) = p(u) = x, 


et il suffit de remarquer que zx», appartient à À; pour tout m pour conclure. & 


3.6.2 Points à l'infini 


On conserve les notations de la Section 3.6.1. La frontière OA; de À; est l’en- 
semble 


A; = À;\ A; =P(E)\A; 


que nous noterons A®. C’est le complémentaire de À; dans P(E). On rappelle 
que (Section 3.5.1) : 
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Définition 3.8 Par définition, A7 = P(E)\A; = 04; est l’ensemble des 
points à l’infini de À;. C’est aussi l’ensemble des directions des droites de 
A! = KA N {x; = 1} que l’on confondra avec A. 


Avec cette définition, P(E) apparaît comme la réunion disjointe de À; et des 
directions des droites de À;, ce que l’on note 


P(E) = AU AT. 


Cette description de P(Æ) comme réunion d’un espace affine 4; et d’un en- 
semble de points A® formés de "points à l’infinis" de À;, est précieuse et 
parle à notre imagination". Les points de A® complètent idéalement notre 
espace affine À; en en faisant un espace métrique compact. 

On fera attention tout de même : cette "complétion" n’est parfaite que pour la 
métrique que nous avons définie sur P(Æ), et non pour la distance hilbertienne 
usuelle sur À;, puisque, pour cette distance hilbertienne, À; est déjà un espace 
complet ! 

L'expression "points à l'infini" est justifiée par le Théorème suivant : 


Théorème 3.10 Pour tout suite (x) de l’espace affine À;, et en notant ||xy|| 
la norme euclidienne de xx dans À;, 


lim d(x, A7)=0 & lim [xl] = +0. 
—+00 k—+00 


Preuve : Conservons les notations de la preuve du Théorème 3.9. Par défini- 
tion de la distance d dans P(E), 


d(xr, A) = d ( 1) | 


ITx 


Le Théorème de Pythagore appliqué deux fois montre que pour un point quel- 
conque y = (Yo... Yn) de la sphère S(E), 


dy, 7) = 1/2 24/1 — ul :=  (lyél) 


On trouve en effet (en utilisant la FIG. 3.7 qui représente la situation en 
coupe) : 


d(u,S))=MP = VMH?+HP? 


Vh?l+ OP - OH} 


— y + (1—41/1-— 1/72)? = 2-21 hé 
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M(V65-Y,) 


O H P 


Fic. 3.7 - Calcul de d (y, S?) = MP 


Le point zx; € À; de coordonnées homogènes (x): 2): 1,20) ; …2®) 


est identifié au point CS +. o. mn, …2®) de l’espace affine À;. Aïnsi 


Iæxll = Va$y +... + (x 2 + (re y2 +... + (x »2, et la i-ème coordon- 


née de x4/||x4|| est 1/||xx||. On a donc 


ee) Tk 0 1 
oi El 
Gr 47°) CE ) EE 


et l’on peut écrire 


Da ZT 


1 
Mzxll —+o 5 0 & d(x, 47) —0.u 


la] 


3.6.3 Lien avec la topologie-quotient 


De façon générale, si E est un espace topologique et si f : E — Fest une ap- 
plication de E dans un ensemble F, on appelle topologie finale sur F (pour f) 
la topologie la plus fine rendant l’application f continue. Cela revient au même 
de dire qu’une partie U de Fest un ouvert pour cette topologie si et seulement 
si f !(U) est un ouvert de E. 

Ici, nous disposons de la surjection canonique 


p:E—P(E)=(E\{0}/R 


où la relation d'équivalence R est définie par 


TRy = 31€ K* x = y. 


La topologie finale sur P(ÆE), appelée topologie-quotient, est la topologie la 
plus fine rendant la surjection canonique p continue. Le résultat important 
est : 
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Théorème 3.11 Sur P(E) = (E\{0})/R, la topologie induite par la distance 
d est égale à la topologie-quotient. 


Preuve : Notons : 

©, la topologie-quotient sur P(E). Une partie U de P(E) appartient à O, 
si et seulement si pl (U) est un ouvert de E\ {0}. 

On la topologie de l’espace métrique P(ÆE) induite par la distance d définie 
au Théorème 3.7. 
Puisque p : E\ {0} — P(Æ) est continue (pour l’espace métrique P (E), Théo- 
rème 3.8), toute image réciproque pl (B(x,e)) d’une boule ouverte B (x,e) 
de centre x € P(E) et de rayon €, sera un ouvert de E\ {0}, et par conséquent 
toute boule ouverte B (x,€) sera un ouvert pour la topologie O,. On a montré 
l'inclusion 


Om € Og: 


Réciproquement, si U € O4, alors p_! (U) est un ouvert de E\ {0}, donc s'écrit 
comme une réunion de boules ouvertes de Æ, disons 


pt (U) = UB use) 
iel 
Alors 
U = p(p7!(U)) = Jp(B (wi, ei), 
iel 
et pour montrer que U appartient à ©», il suffit de prouver que p(B (ui, &i)) 
appartient à ©, pour tout . Cela prouvera l'inclusion ©, € On, et l’on pourra 
conclure à l'égalité On = Og- 
Montrons donc que 


VueE\{0} VeeRi p(B (u,e)) € On. 


Soit zo = p(uo) € p(B (u,€)), avec uo € B(u,e). Pour tout x’ = p(u!) € P(E), 
il existe 19 € U tel que 


d(x!,xo) = Mi = : 7 — uo||. 
(x', x) Min |laru ol] = [tou — wo|] 


On cherche un réel 7 > 0 tel que B (x0,n) soit incluse dans p(B (u,€)), autre- 
ment dit tel que 


d(x',xo) <n= (x =plu)etu eBlue)). (+) 
Il existe un scalaire Ào € U tel que d(x/,x) = ||\ouou’ — u||. On a 


[ouou — ull < [oo — Aouol| + || Xouo — ul| 
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donc il suffit d’avoir 
ogow — Aouol| < € — || Aouo — u]| 


ou encore LA ] 
! E— oUo — U 
U — U0|| < = 17 


pour obtenir |[ugu! — u|| < €. On vient de prouver l'implication (+), plus 
précisément 


d(zx',xo) <n = (x! = p(uou') et uyu’ € B(u,c)).m 


3.7 Le Théorème de Pappus 


Nous nous plaçons dans la configuration de la FIG. 3.8. 


F1G. 3.8 —- Configuration de Pappus (2 droites et 2 x 3 points) 


Théorème 3.12 On considère deux droites D et D' du plan projectif, et trois 
points distincts sur chacune de ces droites : À, B, C' sur D, et A', B', C' 
sur D’. Les intersections L de (AB) et (A'B), M de (AC") et (AC), et N de 
(B'C) et (BC) sont des points alignés. 


Preuve : Les quatre points À, N, 4!, C sont trois à trois non alignés, si 
bien qu’on peut les choisir comme repère projectif (A, N, 4’,C'). Les coor- 
données homogènes de ces quatre points sont donc A(1:0:0), N(0:1:0), 
A'(0:0:1), C(1:1:1). Cela nous offre les équations de trois droites : 


(OAiy=ses ACN)jia=es (CA)s2=# 
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Ces trois droites contiennent respectivement B, B' et M, donc il existe des sca- 
laires p, q, r tels que B(p:1:1), B'(1:q:1), M(1:1:7r). Cela nous permet 
d'écrire les équations de 6 autres droites : 


(AB) : y=agz; (AM):z=7ry; (BN):zx=pz; 
(AB) : æ=9p; (AB) :y=q2 ; (MN rx. 


Puisque L € (4'B)N (AB), ses coordonnées homogènes (x : y : z) vérifient 


és. 
TUE 


et montrer que L appartient à (MN) revient à prouver l'implication 


On remarque que C” est le point de concours des trois droites (4'B'), (AM) 
et (BN). Ses coordonnées vérifient donc 


y — 7 
Zz =Ty 
T = pz 


d'où æyz = prqxyz. On à xyz # 0 (en effet, si l’une des coordonnées x, y ou z 
est nulle, alors toutes les coordonnées de C” sont nulles, ce qui est impossible), 
et l’on obtient donc la relation pqr = 1. C’est cette relation qui nous permet 
de vérifier l’implication (+). En effet 


T = Py 
Ga ; Tæ he Z=7TxX. HN 
{ in pq pq 

Remarques : 1) Sur la FIG. 3.9, on a reporté les coordonnées homogènes 
des points du repère projectif dans lequel on travaille, ainsi que les équations 
de trois droites. 


2) Le recours au projectif nous à permis de donner une seule démonstration 
pour des figures "affines"' bien différentes. Les dessins suivant montrent des 
situations fort distinctes qui entrent néanmoins dans le cadre général d’une 
configuration de Pappus. En appelant 


T = {((4"B), (AB), ((4'C), (40), ((8'C), (BC”))} 


l’ensemble des trois couples de droites qui interviennent dans Pappus, on ob- 
tient 6 cas de figures : 
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(:0:0) C(:I:D) 


F1G. 3.9 — Choix du repère projectif 


> Si D et D' sont sécantes, 


e Cas n°1 : Tous les couples de 7 sont formés de droites sécantes, 
e Cas n°2 : Seulement deux couples de 7° sont formés de droites sécantes, 


e Cas n°3 : Tous les couples de T sont formés de droites parallèles. 
> Si Det D’ sont parallèles, 


e Cas n°4 : Tous les couples de 7 sont formés de droites sécantes, 
e Cas n°5 : Seulement deux couples de 7 sont formés de droites sécantes, 


e Cas n°6 : Tous les couples de T sont formés de droites parallèles. 


3) Une preuve affine du Théorème de Pappus dans le Cas n°1, et utili- 
sant le Théorème de Ménélaüs, est donnée en ([1], Théorème 66). Le Cas 
n°6, qui constitue une application intéressante des propriétés des homothéties- 
translations, est traité en ([2], Théorème 63). 


Pappus, Cas n°1 Pappus, Cas n°2 
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. C 
Pappus, Cas n°5 Pappus, Cas n°6 


3.8 Le Théorème de Desargues 


3.8.1 Le Théorème et sa preuve projective 


La configuration de Desargues est formée de trois droites concourantes ou 
parallèles contenant chacune deux points. 

L'étude des cas particuliers (existence ou non de points d’intersection de deux 
droites du dessin) complique la démonstration du Théorème dans le cadre 
affine, mais n’est pas nécessaire dans le cadre projectif où deux droites projec- 
tives s’interceptent inévitablement. 

La simplicité de la preuve, effectuée une fois pour tous les cas de figure, illustre 
l'avantage qui existe à travailler dans le plan projectif. 


Théorème 3.13 Dans le plan projectif, on considère trois droites distinctes 
et concourantes D, D', D", et six points distincts placés sur chacune de ces 
droites : À, B sur D ; A’, B' sur D' ; et A", B" sur D”. Si L, M et N désignent 
les points d’intersection des couples de droites ((AA') ,(BB)), ((AA"”),(BB")) 
et (4/4"),(B'B"), alors les points L, M, N sont alignés. 


Preuve : On peut supposer que le triangle AA4/4/” n’est pas aplati, autre- 
ment l’alignement des points L, M, N est trivial sur la droite (A4/4"”). No- 
tons O le point commun aux trois droites D, D', D" et raisonnons sur la 
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F1G. 3.10 — Configuration de Desargues 


FIG. 3.10. Plaçons-nous dans le repère projectif formé par les points À, 4, 4”, 
O (trois points quelconques choisis parmi ces quatre points ne sont jamais ali- 
gnés). Les coordonnées homogènes de ces points sont À (1 :0:0), 4’ (0 :1:0), 
A"(0:0:1),0(1:1:1),et l’on trouve facilement les équations des 6 droites 
suivantes : 


D=(0Miy=z: D's(OA) sr: D AOA ES 
(AA) :2=0; (AA) :y =0; (A'A") :æ=0. 


Puisque B € (OA), B' Ee (OA') et B" € (O A"), il existe trois scalaires p, q, r 
tels que B(p:1:1), B'(1:q:1)et B'(1:1:r). Notre travail est maintenant 
clair : on va déterminer les coordonnées homogènes des points L, M et N, puis 
vérifier que ces points sont alignés. 


e Cherchons les coordonnées homogènes (x : y : z) de L. 
On a Le (AA')N (BB), et une équation projective de (BB) est 


x &e à 

RS) 

mQ 
Il 
(=) 


soit (BB) : (1 — q)æ—(p — 1) y+(pq — 1) z = 0. Les coordonnées de L vérifient 
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donc le système 


z=0 
(A—g)z+(1—p)y+(p9—1)2=0 
donc L(p—1:1—-g:0). 


e De la même façon M € (AA4") N(BB"), donc M appartient à la droite 
(AA") d’équation y = 0 et à la droite (BB) d’équation 


ù © 8 
RH HR 


1 
1L|=(r-1)z-(pr-1)y+(p-1)2=0. 
de 
Ainsi M(1—-p:0:r—1). 
e Enfin Ne (4'4”)n(B'B"), donc N appartient à la droite (4’ 4”) d’équa- 


tion + = 0 et à la droite (B’B") d’équation 


= (gr (r-1)y+(1—9)z=0 


ù © 8 
RQ H 
Y rh 


Ainsi N(0:1-g:r—1). 


e Montrer que L, M et N sont alignés revient à montrer que le déterminant 
dont les colonnes sont formées des coordonnées homogènes de L, M et N est 
nul. La vérification est aisée : 


p—1l 1-p O0 1 0 
1—-g O0 1-g|=(p-1)(1-qg)(r-1)| 1 0 1]—=0.s 
O0 r—-1 r—-1 O 1 1 


Remarques : 1) Dans la dernière partie de la preuve, on utilise une carac- 
térisation de l’alignement des points Z, M et N utilisant le déterminant des 
coordonnées homogènes de ces points. Cette caractérisation provient des défi- 
nitions mêmes des droites projectives, images de plans vectoriels d’un espace 
vectoriel Æ de dimension 3 par la projection canonique p : E\ {0} — P(E).Si 
l, m et n désignent des vecteurs de Æ qui se projettent respectivement sur L, 
M et N par p, autrement dit si L = p{(l), M = p(m) et N = p{n), alors 


L, M, N alignés & {, m, n coplanaires & | Yy Ym YUn | = 0 
Z 2m 2n 
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où (x, y, 4), (Æms Yms 2m); (Æns Yns Zn) représentent les coordonnées respec- 
tives des vecteurs {, m, n dans une base (e1,e2,e3) de E. Par définition, les 
triplets (x : y : A), (Xm : Ym : 2m); (En : Yn : Zn) Sont aussi les coordonnées 
homogènes des points L, M et N dans cette base. 


2) L’homographie transformant les points À, B, C respectivement en À/, 
B', C' permet d’obtenir le Théorème de Pappus comme une conséquence du 
Théorème de Desargues ([3], 8. 2.2.2). 


3) La réciproque du Théorème 3.13 est vraie ([3], Th. 2.4) : Si les points Z, 
M et N sont alignés, alors les droites D, D’, D" sont concourantes. 


3.8.2 Les différentes figures possibles 


On peut dessiner les différentes figures que l’on peut obtenir. En géométrie 
affine, une démonstration particulière serait à donner pour chacune de ces 
figures. 

L'utilisation du plan projectif permet à la fois de simplifier l’énoncé du résultat 
et d’unifier les différentes preuves correspondant à des cas de figures bien 
différentes. Finalement, en une seule preuve, nous avons démontré "beaucoup". 
On notera que, du point de vue projectif, il n’existe pas plusieurs Théorème 
de Desargues, mais un seul énoncé qui possède de multiples facettes affines. Si 
l’on note 


T={((44),(88)),((88),(c07)),((C0"),(44))}, 


on dénombre 6 cas de figures différentes dans Desargues : 


> Si D, D' et D" se coupent dans le plan affine (où l’on dessine), 
e Cas n°1 : Tous les couples de 7 sont formés de droites sécantes, 
e Cas n°2 : Seulement deux couples de T° sont formés de droites sécantes, 
e Cas n°3 : Tous les couples de T sont formés de droites parallèles. 

> Si D, D'et D" se coupent à l'infini, 
e Cas n°4 : Tous les couples de T sont formés de droites sécantes, 
e Cas n°5 : Seulement deux couples de T° sont formés de droites sécantes, 
e Cas n°6 : Tous les couples de T sont formés de droites parallèles. 
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Desargues, Cas n°5 Desargues, Cas n°6 
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Les figures obtenues aux Cas n°3 et n°6 sont celles d’un autre énoncé dû à 
Desargues concernant les triangles homothétiques (deux triangles sont dits ho- 
mothétiques s’ils se déduisent lun de l’autre par une homothétie-translation). 
Cet autre "Théorème de Desargues"' nous donne une condition nécessaire et 
suffisante pour que deux triangles soient homothétiques. La démonstration 
étant facile, elle peut être retenue. Il s’agit du Théorème 3.14 : 


Théorème 3.14 Dans un espace affine de dimension quelconque, deux tri- 
angles ABC et A'B'C' sont homothétiques si et seulement si leurs côtés sont 
deux à deux parallèles. 


Preuve : La condition est évidemment nécessaire puisqu’une homothétie- 
translation transforme une droite en une droite parallèle. Montrons qu’elle 
est suffisante. Supposons que les trois couples ((AB),(4'B')), ((BC) ,(B'C")) 
et ((C'A),(C"4')) soient formés de droites parallèles entre elles. 

Si A = À, ou B = B, ou C = C, il est facile de vérifier qu’une homothétie 
transforme les sommets de ABC en ceux de 4’B/C" (si À = 4/, l’homothétie 
de centre À et de rapport ÂB’/AB transforme B en B/, mais aussi C en C’). 


Supposons maintenant que les droites (A4'), (BB) et (C'C") sont bien définies. 
Puisque (AB) est parallèle à (4/B'), les points À, B, 4', B' sont coplanaires, 
et les droites (A4’) et (BB) seront parallèles ou sécantes. On envisage deux 


cas : 
A À A 
A 
L B 
B C B C 


F1G. 3.11 — CNS pour que 2 triangles soient homothétiques 


e Si les trois droites (A4), (BB) et (CC) sont parallèles, les quadrilatères 
AA B'B et BB'C"C sont des parallélogrammes, et la translation £ de vecteur 
AA’ amène À, B, C resp. sur 4’, B', C". 

e Sinon, deux des trois droites sont sécantes en un point ©. Supposons 
par exemple que (A4’) coupe (BB) en O. L’homothétie À de centre O et de 


128 CHAPITRE 3. INTRODUCTION AUX ESPACES PROJECTIFS 


rapport O4'’/OA amène À sur 4’, mais aussi B sur B'. h transforme la droite 
(AC) en une droite parallèle à (AC') passant par À/, c’est-à-dire en (4/C"). De 
même À transforme (BC) en (B'C"). Puisque À est bijective, 


h({C}) R((AC)N (BC) 


h((AC))n A((BC)) = (4'C") n (8'C") = {C'}, 


donc hA(C)=C". s 


3.9 Dualité 


3.9.1 Le principe 


Soit E — P(ÉË) un espace projectif de dimension 2 associé à l’espace vecto- 
riel E. Soit D : É El projection canonique de E sur E. On sait que 
l’ensemble Æ* des formes linéaires définies sur Æ forme un espace vectoriel de 
même dimension que FE. 

On considère l’espace projectif E* — P(E*) associé à E*, et l’on note encore 
(abusivement) p la projection canonique p : F*  E* (FIG. 3.12). 


E D N 
TZ LT 
= Se 
p p 
D-p(D) 
M-p(M) e(D}-p(D 1) 
P(E) Pre P(E*) 


FIG. 3.12 — D'un espace à l’autre 
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— 
On définit une fonction | ® qui à des droites et des plans de Æ associe des 
droites et des plans de £*, de la façon suivante : 
HT = _ : #4: — . 
a) À une droite M de Æ on associe le plan M de E* constitué par toutes 
— — 
les formes linéaires sur Æ qui s’annulent sur M (lorthogonalité est à considérer 
ici dans le cadre de la dualité), 
— — ; ci — . 
b) À un plan D de E on associe la droite D-— de E* constituée par toutes 
— — 
les formes linéaires sur Æ qui s’annulent sur D . 
Cette correspondance nous permet de définir une application 4 qui à des points 
et des droites de Æ associe des droites et des points de E*, de la façon suivante : 
— — 
a) À un point M = p(M) de E on associe la droite &(M) = p(M—) de E*, 
_— 
projection de (M) sur E*, 
— 
b) À une droite D = p(D) de E on associe le point w(D) = p(D—) de E*, 
— 

projection de ®(D) sur E*. 


On vérifie alors : 


Théorème 3.15 

(P1) Par @, l’image d’un point est une droite, et l’image d’une droite est un 
point. 

(P2) Si M appartient à la droite D, alors ÿ(M) contient o(D). 


La propriété (P2) s'écrit 
MED = v(D)ev(M) 


et montre que si M et N appartiennent à la droite D, alors w(D) est un point 
situé à l'intersection des droites (M) et &(N). 


Par exemple, la FIG. 3.13 montre que la correspondance 4 fait passer de 
la configuration de Ceva et celle de Ménélaüs, et réciproquement. Les deux 
configurations sont donc duales l’une de l’autre. 


De façon générale, dès qu’il s’agit de problèmes d’alignement et de concours, 
utilisation de la dualité, qui permet de passer d’une figure (formée de points et 
de droites) à une autre figure (en échangeant les rôles des points et des droites) 
permet de déduire mécaniquement de nouveaux résultats qui peuvent être très 
intéressants. Nous allons voir cette méthode en oeuvre sur deux exemples. 


3.9.2 Le dual du Théorème de Pappus 


La correspondance utilisée sur la configuration du Théorème de Pappus nous 
permet d'obtenir un nouveau Théorème qui est loin d’être une trivialité : 
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p(B) _P(C) 


p(A) 


F1G. 3.13 — Dualité : Céva et Ménélaüs 


Théorème 3.16 (Dual du Théorème de Pappus) On considère trois droites 
a, b, c sécantes en d, ainsi que trois autre droites a’, b', c’ sécantes en d’. Alors 
les trois droites joignant a Nb! et a Nb, bNc et b'Nc, puis cha et Na, 
sont concourantes. 


Preuve : La FIG. 3.14 nous montre le passage de la configuration de Pappus, 
dans le dessin du haut, vers la nouvelle configuration dans le dessin du bas, 
via la correspondance (. 


On traduit les hypothèses. Dans Pappus, on dispose de deux droites D et D’ 
contenant chacune trois points : À, B, C pour D, et 4/, B', C' pour D’. 
D’après le Théorème 3.15, w(D) sera un point appartenant à chacune des 
droites 6 (A), w(B), y (C). Et de même, w(D') sera un point appartenant à 
chacune des droites 4 (4), w(B'), w(C"). 

Le point L appartient à (AB) et à (4'B). On a 


Le (AB) = p((AB')) ep(L), 


et l’on remarque que  ((AB')) est un point situé à l’intersection des droites 
(A) et w(B). Ainsi la droite @ (L) passe par l'intersection des droites 4 (À) 
et w(B). 

En recommençant de la même façon, mais en partant de l'implication 


LE (AB) = p((4'B)) ep(L), 
on montre aussi que w(L) passe par l'intersection des droites 4 (4) et w(B). 


En conclusion @ (L) est la droite joignant 6 (A)N4(B") et y (4')Ny(B). De 
la même manière, on constate que : 
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a'= q(A' 
b'=o(B) 
e = g(C) 


c'=p(C") on b=(B) 


F1G. 3.14 — Le Théorème de Pappus et le résultat dual 


- Y(M) est la droite joignant w (A) N4(C") et y(4')Nw(C), 
- G(N) est la droite joignant w(B)Nw(C") et w(B'}Nnv(C). 


La situation est bien celle décrite dans le Théorème (et décrite sur la FIG. 3.14). 


Il est temps de traduire la conclusion du Théorème de Pappus selon laquelle il 
existe une droite À contenant les points L, M et N. La traduction donne cela : 
il existe un point w (A) appartenant à l'intersection w (L)N&(M)Nv(N). 


Les trois droites &(L), 6 (M) et & (N) sont donc bien concourantes ! mi 
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3.9.3 Réciproque du Théorème de Desargues 


Quel est l’énoncé dual du Théorème de Desargues ? Le Théorème de Desargues 
(Th. 3.13) s'écrit : 


OE(AB) (AA')n(BB') CA 
droite A 


OE(A'B) —=3z (AA")n(BB") CA (+) 
OE(A"B") (4'A")Nn(B'B")CA 
(voir FIG. 3.15). L'énoncé dual est donc : 
p(AB) € (0) p (A) e p((AA4')N (BB')) 
p(A'B)Ep(0O) —= point (A) p(A)ep((AA4")N(BB")) (#) 
p(A"B") € 6 (0) g (A) e p((4'4")N (B'B")). 
[Remarque au sujet des notations : pour simplifier, je noterai ÿ(AA') au lieu de 
((AA')) le point image de la droite (AA) par , et (ÿ(AA')o(BB)) la droite 
passant par les points ÿ(AA") et Y(BB'), et ainsi de suite... Je m'autoriserai 
aussi à noter indifféremment M ou {M} quand cela m'arrange, pour donner 
un sens aux écritures du style 5 ((AA4')N(BB)).] 
La FIG. 3.15 nous permet de comprendre l’analogie entre les assertions (x) 
et (K). On constate par exemple que 


p((44)N(BB")) = (e(AA')v(BB")) 


p((AA”)N(BB")) = (p(44”)0(BB")) (1) 
e((447)n(B'B")) = (e(4’4”)e (BB), 
ce qui se vérifie en rappelant que la droite 6 ((44') N(BB')) contient w(AA') 
et Y(BB}), et ainsi de suite. La FIG. 3.15 suggère aussi que : 
{e(AB)} = (p(44)2(A4"))n (£(BB')v(BB")) 
{e(4"B)} =(p(449(44))n (p(BB')e(B'B")) (2) 
{e(4"B7)} = (6(44")0(4/4")) n (p(BB”)p(B"B")). 
Pour justifier par exemple la première égalité de (2), on remarque que (A) est 
une droite qui passe par les points w(44”) et w(A4"”), et que par conséquent 
p(A) = (,(A4')p(A4")). De la même façon v(B) = (p(BB')v(BB")) et 
(e(44)9(44")) N (p(BB')p(BB")) = p(4)N v(B) = {p(AB)}. 
En utilisant (1) et (2), l'implication (*K) s'écrit : 


( 
(p(AA'}e(A4")) n (p(BB')#(BB")) € (0) 
(p(AA'}o(4'4")) n (p(BB'}e(B'B")) € y (O) 
(e(AA")p (4/45) n (p(BB")e(8'B") € (0) 
p (A) € (p(AA')o(BE")) 
+ 3 point p(A) 4 p(A)e (p(44")p(BB") 
p (A) € (p(4'A")o(B'B")). 
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On reconnaît l'implication réciproque de l'implication (x). En conclusion : 


Théorème 3.17 L'énoncé dual du Théorème de Desargues n’est autre que la 
réciproque du théorème. 


p(A"B") 


F1G. 3.15 — Dual du Théorème de Desargues 


On dit que le Théorème de Desargues est auto-dual pour signifier que sa réci- 
proque est exactement l’énoncé dual. Et finalement, on a bien démontré cette 
réciproque en utilisant la dualité. Enonçons-la : 


Théorème 3.18 (Réciproque du Théorème de Desargues) Dans le plan 
projectif, on considère trois droites distinctes D, D', D", et six points distincts 
placés sur chacune de ces droites : À, B sur D; À, B' sur D'; et A", B" 
sur D". On note L, M et N les points d’intersection des couples de droites 
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((44),(BB)), ((44”),(BB")) et (A'A"),(B'B"). Si les points L, M, N 
sont alignés, alors les droites D, D', D" sont concourantes. 


3.10 Homographies 


3.10.1 Définitions 


Toute application linéaire injective u d’un espace vectoriel E vers un espace 
vectoriel F se factorise en une application P (u) entre les espaces projectifs 
P(E) et P(F). En effet, si x = y il existe À € K* tel que y = Àx, donc 
u(y) = Au(x). u étant injective, aucun des vecteurs u (x) ou u (y) n’est nul, 
et l’on peut écrire 


On peut donc poser 


Le diagramme suivant est commutatif : 


E = F 
P| [P 
P(E) ee P(F) 


Définition 3.9 L'application P (u) est l’application projective associée 
à u. Une application projective bijective est une homographie. 


3.10.2 Premières propriétés 


Théorème 3.19 Une application projective P (u) est toujours injective. 


Preuve : En effet 


P(u)(à)=PQ)(ÿ) + a = 
= JE K* u(y) = Au(x) 
= JE K* y—=Ar (car u injective) 
> ZX —=VY.M 


Théorème 3.20 L'application linéaire injective u est bijective si et seulement 
si P(u) est bijective. 
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Preuve : Comme u et P(u) sont toujours injectives, il reste seulement à 
vérifier que u est surjective si et seulement si P (u) l’est. 
Si u est surjective, et si y € P(F), il existe x € E tel que u (x) = y. Alors 


Pu) (à) = u(x) = ÿ, 
et y possède au moins un antécédent dans P(E). 


Réciproquement, si P (u) est surjective et si y est un vecteur quelconque de F, 
il existe x € P(E) tel que 
P(u) (à) = ÿ 


d’où u(x) = y et l'existence d’un scalaire non nul À tel que y = Au(x). Par 
suite y = u(Ax) possède bien au moins un antécédent par u. m 


Théorème 3.21 La composée de deux applications projectives est encore une 
application projective. Plus précisément, si u : E — F etv: F — G sont 
deux applications linéaires injectives, alors P(vou) = P(v)o P(u), et bien 
sûr P (Id) = Id. 


Preuve : Remarquons d’abord que l’application P (vou) est bien définie 
puisque v o u est injective comme composée de deux injections. 
Pour tout x € P(E), 


donc P(vou) = P(v)o P(u). Par ailleurs P(/d)(x) = Td(æ) = x pour 
tout & EP(E), donc P (Id) = Id.w 


Théorème 3.22 La composée de deux homographies est une homographie. 
L'ensemble des homographies de P(E) dans P(E) est un groupe pour la com- 
position des applications. 


Preuve : L'ensemble des homographies de P(E) dans P(E) n’est pas vide (il 
contient P (Id) = Id), est stable par composition d’après le Théorème 3.21, et 
l'application réciproque d’une homographie P (u) est encore une homographie : 
c’est P(u!) puisque 


P(u-1)oP(u) = P(u)o P(u-!) = P(Id) = Id. 


Définition 3.10 Le groupe des homographies de P(E) dans P(E) est noté 
GP(E) et appelé groupe projectif de l’espace vectoriel E. 
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Théorème 3.23 Si u et vu sont deux applications linéaires injectives de E 


vers F', alors 
P(u)=P{v) & ke K* v=ku. 


En particulier P (u) = Id si, et seulement si, u est une homothétie vectorielle 
de rapport non nul, et GP(E) = GL(E) /KY. 


Preuve : La condition est suffisante. Montrons sa nécessité. 
Dire que P(u) = P (v) revient à dire que pour tout x € E, les vecteurs u (x) 
et vu (x) sont colinéaires. Il existe donc k, € K tel que 


VxeE v(x) =k;.u(x). 


On vérifie que k, est indépendant de x. 


e Six et y sont linéairement indépendants, u (x) et u (y) le seront aussi 
et 


v(r+y)=v(x)+u(y) = kcyu(x + y) = k.u (x) + ky.u (y) 
+ ko (t) + krsy.u (y) = kr.u (&) + ky.u (y) 
Le koty — ky — ky. 


e Si x et y sont liés et x non nul, et si dimE > 2, on peut toujours 
passer par l'intermédiaire d’un vecteur z n’appartenant pas à la droite Vect (x) 
et appliquer deux fois le résultat précédent pour obtenir k; = k; = ky. Si 
dim Æ = 1, on note y = Àx et l’on conclut en écrivant : 


v(y)=Av(x) = ky.u(y) = Akr.u (x) 
+. AbRulr) = ke (es) 
+  ky=kr. 


Pour terminer, on montre que GP(E) = GL(E)/K* en décomposant cano- 
niquement le morphisme de groupes #Ÿ : (GL(EÆ),0) — (GP(E) ,o) qui à u 
fait correspondre P (u). Dans la notation GL(E) /K*, il faut être conscient 
que X* désigne le noyau de 4}, c’est-à-dire le groupe des homothéties de Æ (et 
que la notation est un tantinet cavalière !). m 


Remarque : On aurait pu court-circuiter une partie de la démonstration 
précédente en rappelant le lemme d’algèbre linéaire bien connu suivant lequel 
tout endomorphisme qui laisse stable toutes les droites vectorielles est une 
homothétie ([1], Th. 33). 


Théorème 3.24 Une application projective transforme une droite en une droite 
(et en particulier, elle conserve les alignements de points, c’est-à-dire trans- 
forme trois points alignés en trois points alignés). 
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Preuve : Considérons une application projective P (u) : P(E) — P(F), et 
une droite (æy) de P(ÆE). Ici (xy) désigne la droite p(Il) où II = Vect (x, y) 
est le plan vectoriel de Æ engendré par x et y. Si z € (xÿ), il existe deux 
scalaires À et y tels que z = Àx + uy, donc 


P(u)(à) = ut) = Je) + puy. 


Cela montre que u(z) € Vect (u (x) ,u (y)), autrement dit que les points u(z), 
u®), et uy) ) sont alignés. Le point P(u)(z) appartient par conséquent à la 


droite (u(x) u D). On a montré l'inclusion 


P(u) (Gÿ)) € (ut) u(y)). 
Réciproquement, si 2 appartient à la droite (ue ) alu) est un vecteur de 
Vect (u (x) ,u (y)) et il existe À et u tels que z/ = Au(x)+uu(y) = u (Àx + y) 


Par suite 
P(u)(x + uy) = ur + ny) = # 


où À? + y est un point de la droite (#ÿ), donc ? € P(u) ((æy)), et inclusion 
réciproque est démontrée. = 

Remarque : On démontre que GP (R"*!) est égal au groupe des colli- 
néations, c’est-à-dire au groupe des bijections qui conservent l’alignement. Ce 
n’est pas le cas du groupe projectif GP (E) en général. 


3.10.3 Conservation des repères projectifs 


Théorème 3.25 Soient (Po, P1,.…, Pr+1) et (Qo, Q1,.…., Qn+1) des repères 
projectifs respectifs de P(E) et de P(F ). Îl'existe une et une seule homographie 
de P(E) dans P(F) qui envoie P; sur Q; pour tout i. 


Preuve : Par hypothèse (Définition 3.5), il existe une base e = (e0,.…, en) 
de E et une base f = (fo,.…, fn) de F telles que : 
eVie{0,1,..,n} P;=ple;)et Q; =p(jf;); 
+1 = PS 50 ei) et Qn+1 = Po fi). 

S'il existe une homographie à = P(u) : P(E) — P(F) satisfaisant aux condi- 
tions du Théorème, alors u(e;) et f; sont colinéaires quels que soient les in- 
dices 1, et il existe des scalaires À; tels que u(e;) = À;fi. Mais il existe aussi 
un scalaire À tel que u (5 6) = AD 0 fi, ce qui s'écrit 


D Xiti = À ÿ Fe 
Ù = 
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Par suite À9 = … = À = À. L'application linéaire uw, qui vérifie u(e;) = Xf; 
pour tout 2, est ainsi parfaitement déterminée sur chacun des vecteurs de la 
base e, donc unique. L’unicité de « est démontrée. 

Pour vérifier qu’il existe au moins une homographie « solution, on considère 
l'application linéaire u de E dans F (obtenue précédemment) qui transforme 
la base e en la base f, et l’on pose à = P(u). Bien sûr 


Vie {0,..,n} a(P;)=P(u)(Pi) = plu(e)) =p(f) = Q, 
mais aussi : 


Q(Pn+1) = P(u) (Pa+1) = p É œ «)) =p | ï) = Qn+1: 5 
i=0 


i=0 


3.10.4 Lien avec les fonctions homographiques 


> Cas de la droite projective P(R?) 


Travaillons dans P(R?) rapporté à un repère projectif dans lequel tout point 
de P(R?) admet des coordonnées homogènes (x : y). Conservons les notations 
de la Section 3.5 en les simplifiant un peu : À désigne le complémentaire de 
l'hyperplan H de P(R?) d’équation y = 0, donc 


A={M(x:y)EeP(R?)/y #0}. 
On sait que À est un espace affine de dimension 1, donc isomorphe à R. La 
bijection f qui permet d'identifier À à R est 
f: K — A=P(R)\H 
T M (elle 

Une homographie de P(R?) s’écrit P(u) où u € GL(R?) est défini par une 
matrice de déterminant non nul dans la base canonique de R?. Autrement dit, 
Pendomorphisme u est définie analytiquement en écrivant 


(#)= Ce 2)0) 


où ad—bcZ£0.Ona 


P(u)(z:y) = (2,9) =(x':7). 
La question est de savoir quelle est la restriction h = P(u)|4 de P(u) à À, 


et nous ne voulons pas seulement restreindre P (u) au départ, mais aussi à 
l’arrivée pour nous intéresser à l’application 


h= P(u)|4: À — À. 
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La question est donc de savoir si, étant donné (x : y) tel que y # 0, le réel 
y = cx + dy est nul ou pas. On à 


y=0 & cr+dy=0 & se 
y 


Par suite, si c Æ 0, pour tout t = x/y différent de —d/c (où y Z 0), on peut 
écrire 


roun-ro(é)-(5)- (Eh) (2) 


Compte tenu de l'identification de À à R (détaillée à la Section 3.5 et rappelée 
ci-dessus), À — P(u)|4 : À — À apparaît comme une fonction de R dans R 
qui à t (différent de —d/c) associe 


at + b 
h(t) = : 
(6) ct + d 
Une telle fonction 
h: R — R 
’ at + b 
ct + d 


est appelée fonction homographique. 


Si c — 0, alors d ne peut pas être nul (car ad — bc Z 0), donc ct + d = d n’est 
jamais nul, et h est définie sur tout R (la fonction À devient une application 
de R dans R). C’est l’application affine : 


h: R — R 


at + b 
tr ; 
d 


Remarque : Comme P(vou) — P(v)o P(u), on peut estimer que la 
composée g o h de deux fonctions homographiques 


k  at+b 9 at+v 
—— et — ——— 

ct + d c't + d' 
sera une fonction homographique restriction de P (vo u) à la carte affine (lors- 
qu'on met de côté tous les problèmes de définition de ces fonctions). Eh bien, 
c’est le cas puisque l’on peut vérifier que 


b | ; at + b!! a! pb" : a b! a b 
FU 00 ct + d'! ANGL oe a LR à c dd) 


140 CHAPITRE 3. INTRODUCTION AUX ESPACES PROJECTIFS 


» Cas général 


Ce qui précède se généralise facilement au cas général où P (u) est une ho- 


mographie de P(R®*1). Dans ce cas P (u) (to : t1 : …. : Æn) = (ab: 21: ….: 24) 
où 

x G00 … On TO 

24 An0O +. Ann Tn 


En supposant x, £ 0 et x}, £ 0, et en posant t; = x;/xn (0 <i<n—1),on 
obtient 


NE LE 
A EE ES D ÉRES md) 


avec 


! 
je Ti G0T0 +. + Ginln _ Qioto + + + Gin—1Ën-1 + Gin 
& — = + . 
de An0TO + +. + AnnTn Qn0to + +. + Gin—1Ën-1 + Ann 


Finalement, les restrictions des homographies aux cartes affines de l’espace 
projectif sont définies analytiquement avec des fonctions coordonnées qui sont 
des quotients de formes affines par une même forme affine. 


3.10.5 Conservation du birapport 


Si les applications affines conservent les rapports de mesures algébriques des 
bipoints de points alignés (on dit plus rapidement qu’une application affine 
conserve les rapports), on montre que les homographies conservent les rapports 
de rapports, c’est-à-dire les birapports. Ces birapports représentent donc des 
invariants de la géométrie projective. 

Considérons une droite projective D d’un espace projectif P (K RE et quatre 
points distincts M1, M, M3, M4 sur cette droite. Considérons un repère pro- 
jectif R de D, notons (x; : y;) les coordonnées homogènes de M; dans R, et 
posons 


T1 Z3 | X2 ZX3 | 

Y1 3 V2  y3 
(Mi, Mb, M3, Mir = 

T1 ZA T2 LA 

V1 Ya | V2 Ya | 


Alors : 
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Théorème 3.26 Le scalaire [M, M2, M3, Milr est indépendant du choix du 
repère projectif R de la droite D. 


Preuve : Si R’ désigne un autre repère projectif de D, et si (x! : y!) désigne un 
système de coordonnées homogènes de M; dans R’, les formules de changement 
de bases dans le plan vectoriel IT associé à D (c’est-à-dire tel que D = p(Il)) 
montre l'existence d’une matrice carrée inversible P telle que 


sa Lol 
vi, j € {1,2,3,4} ee RC A 
Yi V5 Yi  V; 
Par suite 
Ti Ti 


Vi, € {1,2,3,4 
d { } Vi  Yj 


= (det P) x 


! ! 
Ti T; 

! ! 

ï Ÿ 


S. 


et il suffit de remplacer et de simplifier par det P pour obtenir 
[M, M, MB, Malr — [M, Mo, M3, Milr . 1 


Définition 3.11 Le scalaire [M1, M, M3, Mir, noté [M1, M, M3, Mi}, est 
appelé birapport ou rapport anharmonique des points M1, M2, M3, MA 
(alignés et distincts). 


L’invariance des birapports sous l’action des homographies se montre sans 
difficulté : 


Théorème 3.27 Une homographie conserve les birapports. Autrement dit, 
une homographie P (u) : P(E) — P(F) transforme quatre points M1, M, 
M3, MA alignés et distincts en quatre points M}, M3, M3, M alignés et dis- 
tincts, et [M\, M5, Mi, Mi] = [M, M, M3, Ma]. 


Preuve : Une homographie est bijective et conserve l’alignement, donc trans- 
forme quatre points alignés et distincts en quatre points alignés et distincts. 
Si M, M, M3, MA sont alignés sur une droite D de P(E), les images M}, Mi, 
M}, M, de ces points par P (u) seront alignées sur une droite D’ de P(F). 
Si (x; : %:) désigne un système de coordonnées homogènes de M; dans un re- 
père R de D, notons II le plan vectoriel tel que D = p (IT) et e — (e1,e2) une 
base de IT associée au repère R. 
L’isomorphisme u transforme la base e de IT en une base u (e) = (u(ez),u(e2)) 
du plan IV = u(Il), et l’on peut utiliser le repère R’ de D’ associé à cette base. 
On vérifie alors que les coordonnées homogènes de M! = P(u)(M;) dans R' 
sont encore (x; : y) : en notant M, = p(£;) où £, = res +yie2 € I, on obtient 
en effet 

Mi = P(u) (Mi) = p(u(é)) = p(iu(er) + yru(ez)). 
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Finalement 
he) 
V1 3 V2 V3 
LM, M5, M3, Mile = : = Mi, M2, M3, Malr 
T1 ZA T2 XA 
| Y1 Ya | | Y2 Ya | 


et l’égalité des birapports est démontrée. m 


Nous avons défini le birapport de quatre points distincts et alignés dans le 
projectif, mais il y à un petit problème. En géométrie affine, nous avons déjà 
travaillé avec un birapport, qui était un rapport de deux rapports de mesures 
algébriques ([1], 8. 16.1), et il est tout à fait naturel de nous poser la question 
de savoir si les deux définitions ne font qu’une là où elles ont toutes les deux 
un sens, c’est-à-dire lorsqu'on se restreint au complémentaire d’un hyperplan 
projectif muni de sa structure affine canonique. 


Prenons E — K”*1 et intéressons-nous à la trace d’une droite D de P(K”+1) 
dans une carte affine À = P (K"+*1) \H où H désigne un hyperplan projectif. 
On peut supposer que À est d’équation x, = 0. Notons D, = D N À, et 
considérons quatre point distincts Mi, M, Ma, MA sur D,. La FIG. 3.16 
représente la droite affine D, et le point à l’infini de D, noté cop. 


——, 


Fi1c. 3.16 - D = D,U {op} 


Choisissons un repère projectif de P(K"*1) dans lequel les coordonnées de 
Mi = p(eo) et M2 = p(e1) sont” : 


Mi=(1:0:0:.::021)=p{é0) 
NE =D TLEUE SSL Len) 


Les vecteurs eo et e1 qui définissent M1 et M ne sont pas colinéaires puisque 
M; £ M2. Comme M3 et M4 appartiennent à la droite (M1 M), il existe des 


5On identifie les points du projectif avec les coordonnées homogènes de ces points dans 
le repère considéré. 
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scalaires À, u, v,T tels que ÀÂ+u=1,17+7=1,et 


M3 = p(Aeo + ue) = (À :u:0:.….:0:1) 
Ma = pÜvei +rTei) =(v:T:0:..:0:1). 


— 
Dans l’espace affine À (identifié à K°”) d'espace vectoriel associé A (identifié 
à K”), les coordonnées affines des points M; sont : 


Mi =\(1;0,0,:;0) € K7 
Mo = (0,1,0, 0) 

M3 = (À, u,0,...,0) 
M7 0, 22 0) 


Par suite 


> > 
MiM3 = (À —1,u,0,...,0) = u(—1,1,0,...,0) = uMiMo 
> > 
M M4 . (v . 1,7, 0,..., 0) — T(—1, 1,0, D) = TM Mo 


donc 
MM3 
Eu (1) 
1M4 T 
De même 
> = 
MM 3 —= (À, = 1,0, s25 0) = À CE —1,0, …., 0) = \BM 
——— ——— 
MMA = (2,T — 1,0, 20) = v (—1, 1,0, …, O) = vMoM: 
et 
M M 
LEE (2) 
MM, V 


(1) et (2) montrent que le birapport "affine" (celui de [1], 8. 16.1) de ces quatre 
points de l’espace affine À est 


_MM3 MM; pu 2 
Se 


MM MM T 


Calculons maintenant le birapport "projectif" [MW, M, M3, Ma] en retournant 
à la Définition 3.11. Utilisons les coordonnées homogènes des points M; dans 
le repère projectif (M1, M, P) de la droite D (où M1 = p(eo), M2 = p(e1) et 
P = p(eo + e1)). Dans ce repère : 


Mai = (Ar 0} M0 De M = Din) Mi (pis) s 
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Li 


LM, Mo, Ms, Ma] = ne 


et tout est pour le mieux dans le meilleur des mondesf ! Nous pouvons énoncer : 


donc 


HO 
9 IE 
= © © 
CO ER 


Lo 


Théorème 3.28 Le birapport de quatre point s'écrit à l’aide de mesures al- 
gébriques : 


MM MM 
MMs MM 


dans n'importe quelle carte affine de l’espace projectif. 


[M, Mb, M3, Mi] = 


Que se passe-t-il lorsque le point M4 de la FIG. 3.16 est envoyé à l'infini ? 
Autrement dit, que devient l’expression 


£ = MM3 . MM; 
MM: MMA 
lorsque MA est égal à op (où {oop} = DNH)? 
Pour obtenir les coordonnées homogènes de M4 = cop dans le repère projectif 
de P(K"71) associé à e — (e9,e1, .…., en), on remarque que 


ep — €1 € Vect (eo, e1) NH, 


donc que 
Ma = cop = p(ep —e1)=(1:-1:0:...:0:0) 


La théorie très sérieuse du philosophe et mathématicien Gottfried Wilhelm Von Leibniz, 
pour laquelle "tout est pour le mieux dans le meilleur des mondes", à été mise à l'épreuve 
de la vie par Voltaire dans "Candide ou l’optimisme". La fin du roman est un morceau de 
bravoure dont on ne se lasse pas : "Toute la petite société entra dans ce louable dessein ; 
chacun se mit à exercer ses talents. La petite terre rapporta beaucoup. Cunégonde était, à 
la vérité, bien laide ; mais elle devint une excellente pâtissière ; Paquette broda ; la vieille eut 
soin du linge. Il n’y eut pas jusqu’à frère Giroflée qui ne rendît service ; il fut un très bon 
menuisier, et même devint honnête homme. 

Et Pangloss disait quelquefois à Candide : tous les événements sont enchaînés dans le 
meilleur des mondes possibles; car enfin si vous n’aviez pas été chassé d’un beau château 
à grands coups de pied dans le derrière pour l’amour de mademoiselle Cunégonde, si vous 
n’aviez pas été mis à l’inquisition, si vous n’aviez pas couru l’Amérique à pied, si vous n’aviez 
pas donné un bon coup d'épée au baron, si vous n’aviez pas perdu tous vos moutons du bon 
pays d’Eldorado, vous ne mangeriez pas ici des cédrats confits et des pistaches. Cela est bien 
dit, répondit Candide, mais il faut cultiver notre jardin." 
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(coordonnées homogènes dans P (K”*1)). Par conséquent : 


| LÀ | | O0 À | 
0 1 y M M 
LM, Mo, M3, op] = = : ——— — DR se 
A Fu \ VV 
0 —1 1 —1 
MM 
Ce rapport 222 est parfois noté [Mi , M, M3], ce qui permet d'écrire 
MM; 
AE 
Mi, Mo, M3, cop] = [M1, Mo, Ms] = | 
[M , Mo, M3, op] = [M, Mo, M3] ARTE 


Avec cette notation, on peut aussi écrire 


M, M, M3] __ MM3 MM; 


M, Mo, M3, Ma] = ee ru 
EM, M, Mal = Te Ml © Th Moi 


pour tous M, M, M3, MA € D, dès que ces quatre points sont distincts. 


3.10.6 Homographies laissant un hyperplan invariant 
Nous avons besoïin de quelques rappels de géométrie vectorielle : 


Définition 3.12 Soient F et G deux sous espaces vectoriels supplémentaires 
d’un espace vectoriel E, et k € K. L'application 


f: E=F6G — E 
T=t+t Ft + kt 


est appelée affinité vectorielle de base (ou par rapport à) F, de direc- 
tion G et de rapport k. 


Définition 3.13 Soient H un hyperplan de l’espace vectoriel E, l'une forme 
linéaire telle que H = Keri, et h un vecteur de H. L'application 


g: E — E 
z + z+l(x)h 


est appelée transvection vectorielle de base (ou par rapport à) H et 
de vecteur h. 


Le résultat important concernant les affinités et les transvections est le suivant 
(la version affine de ce Théorème est proposée en [1], Th. 57 mais ne nous 
intéresse pas ici) : 
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Théorème 3.29 Soient E un espace vectoriel de dimension finie, et H un 
hyperplan de E. L'ensemble des automorphismes de E qui laissent H invariant 
point par point est formé des affinités de base H et de rapport Æ 1, et des 
transvections de base H et de vecteur non nul. 


Preuve : La condition est trivialement nécessaire. Montrons qu’elle est suf- 
fisante. Soit u un automorphisme de Æ tel que Invu = Ker(u — Id) = H. 
On a : 


dim Im (u — Id) = dim E — dimKer (u — Id) = dim E — dim H = 1, 


donc Im (u — Id) est une droite que nous pouvons noter D. 
De deux choses l’une : 


e Si D G H, alors D est stable par u (en effet u et u — Id commutent 
donc u (u(x) — x) = (u — Id) (u(x))) donc u|p est une homothétie de rapport 
k Z 0. Comme E = H&@ D et u]x = Id, l'application u ne peut être que 
l’affinité de base H et de rapport k. 


e Si D C H, on choisit un vecteur non nul D de D et l’on note 6: D — K 
Pisomorphisme qui à ÀD associe À. On a le diagramme 


ET D SK 
\d + À 


L'application { = @o (u — Id) est une forme linéaire de noyau A, et pour tout 
&'eE, — 
(u— Id)(x)=p !({(x)) = u(x)=r+l(x) d. 


Cela montre que u est une transvection de base H. 1m 


On peut maintenant énoncer un résultat remarquable : 


Théorème 3.30 Soient P(E) un espace projectif de dimension n et H un 
hyperplan de P(E). Soit H1 l’espace vectoriel associé à H (i.e. H = p(Hi)). 
Soit T l’ensemble des homographies de P(E) qui admettent H comme ensemble 
de points invariants auquel on adjoint l'identité. 

1) T est formé des homographies P (u) associées aux transvections u de 
base H1. 


2) T est un groupe isomorphe au groupe additif de l’espace vectoriel H:, 


3)T et H; agissent simplement et transitivement sur P(E) \H, de sorte que 
le complémentaire d’un hyperplan projectif soit toujours structuré en espace 


affine. 
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Preuve : 1) Soit P(u) une homographie admettant H = p(H;) comme en- 
semble de points invariants. On a 


Vx € H1 u(x) colinéaire à x, 
donc u|x, est une homothétie, et il existe k € K* tel que 
Vxe Hi u(x) = kx. 


Quitte à modifier u, on peut supposer k = 1. Alors Invu — H; et le Théo- 
rème 3.29 montre que uw est soit une affinité, soit une transvection. Cela ne 
peut être une affinité, sinon il existerait un vecteur a & Hi et un scalaire 
k€ K tels que u (a) = ka, et l'on aurait P (u) (a) = à avec à € H, ce qui est 
absurde. C’est donc une transvection : il existe h; € H tel que 


VxeE u(x)=x+l(x)h. 


2) Il est facile de vérifier que (T',o) est un groupe. L'application 


est bijective, et c’est un isomorphisme de (T,o) sur (H;,+) puisque, si 


{ u(x)=2+1(r) hu 
v(z)=rc+i(x)lh, 


alors, pour tout x € E,, 


(vuou)(x) = v(u(x)) = v(x+l(x)hu) —= v(x) +i(x)u(hu) 
z+l(x)hs +i(x) hu 


soit (vou) (x) = x +1l(x) (ho + hu). 


3) On vérifie que le groupe T opère simplement et transitivement sur P\H 
par l’application 


d: (P(E)\H)xT — P(E)\H 


(a, P (u)) + P(u)(àa) = a+l(a)hu. 


Remarque : Le Théorème 3.6 nous a déjà montré que le complémentaire 
d’un hyperplan projectif est structuré en espace affine, mais la nouvelle preuve 
proposée au Théorème 3.30 est purement géométrique, c’est-à-dire sans appel 
à des coordonnées projectives. 
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Chapitre 4 


Sur les polyèdres eulériens 


Polyèdres eulériens et solides pathologiques. 


(Dany-Jack Mercier!) 


Résumé : La formule $ — À + F = 2 concernant des polyèdres, 
proposée par Leonhard Euler en 1750 sans qu’il soit capable d’en 
donner une preuve rigoureuse, attendra 1794 pour être démontrée 
par Adrien Marie Legendre. Dans cet article, nous voulons pré- 
ciser son champ d’application, imaginer des contre-exemples, et 
retourner sur deux preuves classiques bien jolies : celle de Cauchy 
et celle utilisant la même relation s — a + f — 2 vraie pour des 
graphes connexes. Cette petite incursion dans le monde des po- 
lyèdres s’achèvera avec la preuve de l’existence de seulement cinq 
polyèdres réguliers, encore appelés "solides platoniciens" ou "po- 
lyèdres parfaits". 


4.1 Polyèdres eulériens 


C’est en 1750 que Leonhard Euler propose une formule générale concernant 
les polyèdres. L'idée d’Euler est de comparer les polyèdres à leurs analogues 
dans le plan : les polygones. Cette analogie ne peut malheureusement pas être 
menée bien loin car trop de différences séparent ces deux objets d'étude. Ainsi, 
si un polygone possède autant de côtés que d’angjles, il n’en est plus de même 
d’un polyèdre dont le nombre de faces ne correspond plus au nombre d’angles 
solides qu’il détermine. 


TIUFM de Guadeloupe, dany-jack.mercier@univ-ag.fr. 
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Euler introduit le terme "d’arêtes" (latus en latin, qui à donné lattice en 
anglais, et qui signifie alors "grillage" ou "treillis") et vérifie la règle 


S=AT%F=2 


sur de nombreux exemples. 


Dans cette formule, S désigne le nombre de sommets d’un polyèdre, À le 
nombre de ses arêtes et F le nombre de ses faces. Euler est incapable de 
proposer une démonstration rigoureuse de cette formule, et la preuve qu’il 
annonce un an plus tard contient un défaut embarrassant. 


Il faudra attendre le traité d’Adrien Marie Legendre, intitulé "Eléments de 
géométrie" et paru en 1794 en pleine révolution française, pour lire une dé- 
monstration satisfaisante de la formule d’Euler. Cette démonstration, qui fait 
appel à des notions de trigonométrie sphérique, reste assez éloignée de l’énoncé 
initial... 

La preuve proposée par Augustin Louis Cauchy en 1811 est simple et élégante, 
et c’est évidemment celle que l’on décrit dans la Section suivante. Cette preuve 
possède en outre le mérite de s’appliquer à des polyèdres beaucoup plus géné- 
raux que ceux envisagés par Legendre, et utilise les parties constitutives d’un 
polygone (faces, arêtes, sommets) de manière pertinente. 


4.2 Preuve de Cauchy (1811) 


La preuve se fait en plusieurs étapes visualisées, dans la cas d’un cube, sur la 
FIG. 4.1. 


1. De (a) vers (b) : On choisit une face du polyèdre comme base, puis on 
transporte tous les éléments sur cette base en conservant leur nombre et leur 
position relative. On raisonne maintenant sur une figure plane (un graphe du 
plan) qui possède une face de moins que le polyèdre. Pour un tel graphe, il 
s’agit de montrer la formule S — A+F=1. 


2. De (b) vers (c) : On rajoute au réseau autant de diagonales que néces- 
saire pour que toutes ses faces soient triangulaires, autrement dit on triangule 
la figure. 


3. De (c) jusqu’à (f) : On retire un à un les triangles du réseau en partant 
de l’extérieur. De cette façon, on supprime soit un sommet, une face et deux 
arêtes, soit une arête et une face. Dans les deux cas, la quantité S — A+ F 
demeure inchangée. 


4. Conclusion : La figure (f) de comporte plus qu’un seul triangle pour 
lequel la formule S — À + F = 1 est évidente. 
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() (e) (d) 


FIG. 4.1 — Preuve de Cauchy (le cas du cube) 


4.3 Les solides pathologiques de Lhuilier 


Deux ans après la preuve de Cauchy, le mathématicien genevois Simon Lhuilier 
met en garde ses collègues contre toute généralisation abusive de la formule 
S — A+ F = 2, et exhibe un certain nombre de solides "pathologiques". 

La difficulté réside sans doute déjà dans la définition que l’on peut donner du 
mot "polyèdre". Aïnsi, un polyèdre est-il : 


- un solide plein limité par des faces planes ? 
- ou plutôt une surface constituée d’un système de polygones ? 


Des définitions plus ou moins originales sont données, parfois seulement pour 
éliminer certains solides pathologiques de Lhuilier [4]. Les deux définitions 
suivantes nous seront utiles : 


Définition 4.1 Un polyèdre est eulérien s'il vérifie S — A + F = 2. 


Définition 4.2 Un polyèdre convexe (fermé) est une partie non vide et 
bornée de l’espace obtenue comme l'intersection d’un nombre fini de demi- 
espaces fermés. 

Un point est un sommet du polyèdre s’il appartient à celui-ci et à l’intersection 
d’au moins trois frontières de demi-espaces fermés définissant le polyèdre. 
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Une arête du polyèdre est un segment joignant deux sommets et inclus dans 
l’une des frontières des demi-espaces fermés définissant le polyèdre. 


On imagine bien que tout polyèdre convexe au sens de la définition précédente 
est eulérien. Mais dans un cadre plus général, quels sont les contre-exemples 
de Lhuilier ? 

On dénombre trois grandes catégories d’exceptions. 


> Première catégorie : les polyèdres à structures multiples. 


Un petit cube posé sur une face d’un grand cube (FIG. 4.2.a) possède 16 
sommets, 24 arêtes et 11 faces, donc vérifie S — A + F = 3, 

On peut aussi imaginer que le petit cube creuse l’une des faces du grand cube 
en formant une dépression, ce qui ne change rien au calcul précédent. 


a. Structures multiples b. Un cadre c. Une bibliothèque ! 
pour ce polyèdre : S-A+F=3 S_A+F=0 S-A+F = -n 


F1G. 4.2 - Structures multiples et tunnels 


> Deuxième catégorie : les polyèdres à tunnels. 


Un simple cadre (penser à un cadre en bois entourant une peinture) vérifie 
S—A+F = 0 (FIG. 42.b). On peut aussi simplement empiler n cubes- 
tunnels (c’est-à-dire des cubes privés de deux faces opposées) pour obtenir des 
polyèdres non eulériens pour lesquels S — À + F = —n (FIG. 4.2.c). 

» Troisième catégorie : les polyèdres à cavités. 
Un petit cube imbriqué dans un grand nous donne un contre-exemple simple 
(FIG. 4.3.a). Bien entendu, il ne s’agit pas d’un polyèdre convexe, mais c’est 
à ce prix qu'il n’est plus eulérien et satisfait S — À + F = 4. 
C’est en observant une collection minéralogique montrant des cristaux, et en 
particulier un cristal opaque pris dans un cristal translucide, que Lhuilier eut 
l’idée de ce contre-exemple. 
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a. Cubes imbriqués b. Deux faces annulaires 
et un tunnel 


F1G. 4.3 — Toujours avec des cubes. 


4.4 Une caractérisation des polyèdres eulériens 


La preuve de Cauchy ne peut s'appliquer qu'aux polyèdres qui vérifient les 
trois propriétés suivantes : 


C1. Une des faces étant choisie comme base, toutes les autres 
doivent pouvoir être transportées sur elle sans déchirure ni dupli- 
cature, 


C2. Le réseau obtenu doit pouvoir être triangulé, 


C3. Les triangles obtenus doivent pouvoir être retirés comme 
prévu. 


De façon évidente, tout polyèdre satisfaisant les propriétés C1 à C3 est eu- 
lérien, et la question est de savoir si la réciproque est vraie. Il n’en est rien, 
comme le montre le polyèdre de la FIG. 4.3.b qui est eulérien sans vérifier C1 
à C3. 


C’est Christian Von Staudt qui énonce le premier une caractérisation des poly- 
èdres eulériens. Dans sa "Géométrie de position", publiée en 1847, il démontre 
qu'un polyèdre est eulérien si et seulement si : 

a) Chacun de ses sommets peut être joint à tout autre par une ligne formée 
d’arêtes, 

b) Toute ligne (fermée) de ce genre passant au plus une fois par un même 
sommet sépare la surface en 2 parties. 


La FIG. 4.4 montre quelques lignes fermées du cube satisfaisant la propriété b). 
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F1G. 4.4 — Caractérisation d’un polyèdre eulérien 


4.5 Relation d’Euler pour des graphes connexes 


A. Le langage des graphes 


Le langage des graphes est adapté à l’étude des polyèdres, la démonstration 
de Cauchy ayant la particularité de transformer un problème spatial en un 
problème dans le plan ne faisant intervenir que des sommets, des arêtes et des 
faces. 

Rappelons qu’un graphe (encore appelé réseau) est un schéma formé de 
points et d’arêtes qui relient certains de ces points. Les points, supposés en 
nombre fini, s'appellent des sommets ou des noeuds. L’ordre du graphe est 
le nombre de ses sommets, le degré (ou la puissance) d’un sommet est le 
nombre d’arêtes qui admettent ce sommet pour extrémité. 


On dit que deux sommets liés par au moins une arête sont adjacents (ou 
voisins), qu’une chaîne (ou chemin) est une liste ordonnée d’arêtes telle 
que l’extrémité de chacune (sauf la dernière) soit l’origine de la suivante, et 
qu’un chemin est fermé si son origine et son extrémité sont confondues. Enfin : 


- Un cycle est un chemin fermé composé d’arêtes toutes distinctes, 

- Un graphe est connexe si deux sommets distincts quelconques sont tou- 
jours reliés par au moins une chaîne, 

- Un point terminal est un sommet où n’aboutit qu’une seule arête. 
(Que faut-il savoir sur les graphes pour le CAPES ? voir [2], Chap. 2) 


Avec ces définitions : 


Lemme 4.1 Un graphe connexe qui ne contient aucun cycle possède au moins 
un point terminal. 


Preuve : Un graphe connexe sans aucun point terminal permet la construction 
suivante. Partant d’un sommet 45 quelconque, on choisit une arête d'extrémité 
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Ao et A1. Le sommet À; n’est pas terminal, donc il existe un sommet 42 autre 
que Ào et lié à Ao par une arête. On obtient une chaîne 454142, puis l’on 
continue de proche en proche. Le nombre de sommets étant fini, il existera un 
moment où l’on obtiendra un sommet déjà présent dans la chaîne : on s’arrête 
alors pour exhiber un cycle AoA1...A7_ 1. 0 


Armé de ce Lemme, on peut démontrer une "relation d’Euler" concernant 
des graphes. Le lien avec la relation d’Euler sur les polyèdres apparaîtra juste 
après. 


Théorème 4.1 Soit G un graphe connexe (non vide) dessiné sur une sphère S 
de l’espace affine euclidien de dimension 3. Soit f le nombre de composantes 
connexes de S\G dans S. Le nombre a d’arêtes et le nombre s de sommets 
de G vérifient la relation d’Euler s — a + f = 2. 


Preuve : On raisonne par récurrence sur le nombre d’arêtes de G. Si a = 0, 
8 — 1, f — 1 et la formule est triviale. Supposons la propriété démontrée 
jusqu’au rang a — 1, et considérons un graphe connexe G possédant a arêtes. 
De deux choses l’une : 


Ÿ Premier cas : Il existe un cycle Ao...Ay_1 A0 dans G. Dans ce cas, on 
supprime une arête de ce cycle, par exemple [A5A1], pour obtenir un graphe G” 
à a— 1 arêtes, s sommets et f —1 composantes connexes. L'hypothèse récurrente 
s’applique à G”, et donne 


s—(a—-1)+(f—1)=2, 


soit s— a+ f = 2. 


Ÿ Second cas : G ne contient aucun cycle. Le Lemme précédent montre 
l’existence d’un sommet terminal À de G. Le graphe G’ obtenu en supprimant 
ce sommet et l’unique arête qui y aboutit possède a — 1 arêtes, s — 1 sommets 
et toujours f composantes connexes. L'hypothèse récurrente donne 
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soit encore $s — a + f — 2.1 


B. Une autre preuve de la relation d’Euler pour les polyèdres 
Considérons maintenant un polyèdre convexe (Définition 4.2). De façon intui- 
tive, un tel polyèdre ne ” possède aucun trou”, et on peut le ”gonfler” jusqu’à 
obtenir une sphère. On montre alors : 


Corollaire 4.1 Tout polyèdre convexe (non aplati) est eulérien, autrement dit 
possède S sommets, À arêtes, et F faces satisfaisant la relation S — A+F = 2. 
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Preuve : Un polyèdre convexe non aplati P contient nécessairement quatre 
sommets À, B, C, D non coplanaires. L’isobarycentre G de ces quatre sommets 
appartient à l’intérieur du tétraèdre T = ABCD. Puisque P est convexe, il 
contient T°, et G est un point de l’intérieur topologique de P. On peut donc 
trouver un réel strictement positif r tel que la sphère $ de centre G et de 
rayon r soit incluse dans l’intérieur de P. L'application 


£: OP — S 
M + 6(M) 


qui au point M de la frontière OP de P associe lunique point N = £(M) 
intersection de [GM] et S, est bijective. Elle est aussi continue puisque 


ze à r cree 


ON OM. 
NGM|] 


c’est donc un homéomorphisme de OP sur S. Les images par £ des sommets 
et des arêtes de P forment un graphe connexe dessiné sur la sphère S, et l’on 
peut appliquer le Théorème 4.1. 


Cette preuve de la relation d’Euler nous montre l’importance des propriétés 
topologiques des ensembles sur lesquels on dessine. Des graphes dessinés dans 
un espace affine, sur une sphère, ou encore sur un tore, n’ont pas la même 
l'valeur". On peut par exemple penser à la relation d’homotopie des chemins 
continus fermés dessinés dans un espace topologique : deux chemins continus 
fermés (des "lacets"') sont homotopes s’il existe une déformation continue du 
premier qui amène sur le second. Si un lacet L dessiné sur une sphère est 
toujours homotope à un point, il n’en est pas de même d’un lacet dessiné sur 
un tore (il suffit pour cela que ce lacet "entoure" le "trou" du tore). Bref, 
ces notions nous mènent directement sur celle de classe d’homotopie dans un 
espace topologique. 

La preuve précédente fonctionne avec des polyèdres convexes, mais pourrait 
être adaptée à des polyèdres "pathologiques" en décidant de projeter arêtes 
et sommets de celui-ci sur un espace topologique adapté (par exemple un tore 
si notre polyèdre est formé de deux cubes imbriqués, comme à la FIG. 4.3.a). 
Les notions de connexité par arcs et d’homotopie jouent un rôle crucial dans 
l’étude de « polyèdres généraux ». 


C. Une conséquence importante : les 5 solides platoniciens 


La relation d’'Euler permet de montrer facilement qu’il n’existe que 5 polyèdres 


réguliers convexes. Ces polyèdres « parfaits » apparaissent dans les discours 


de Platon, et méritent à ce titre d’être qualifiés de « platoniciens »?. 


?Socrate : Dis-moi, Théétète, ce qu’est un polyèdre. 
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Définition 4.3 Un polyèdre convexe non aplati est régulier si : 
a) Sur chacun des sommets aboutissent le même nombre p d'arêtes (p > 3), 
b) Chacune des faces possède le même nombre q de côtés (q > 3). 


AE Cube 
TRS à &=8. a=12. f=6 ae. 


Dodécaëdre 
&=20, a=30, f=12 


Icosaëedre 


Octaëèdre 
&=12, a=30, f=20 


s=6, a=12, f=8 


FIG. 4.5 — Les 5 solides platoniciens 
Théorème 4.2 Il n'existe que 5 polyèdres régulier (ce sont les 5 solides pla- 
toniciens représentés à la FIG. 4.5). 


Preuve : Soit P un polyèdre régulier. Une arête est le côté de deux faces, donc 
Fq = 2A. Puisque p arêtes aboutissent sur chacun des sommets, on devrait 


Théétète : Eh bien, le tétraèdre, le cube, l’octaèdre, le dodécaèdre et l’icosaèdre sont des 
polyèdres… 
Socrate : Ce sont là des exemples, je te demande ce qu’est le polyèdre... 

La question posée par Socrate dans ce dialogue reste primordiale ! Définir un polyèdre n’est 
pas facile, et chercher un échappatoire dans l’énumération des polyèdres que l’on connaît ne 
suffit pas à définir cet objet d’étude. Les premiers dialogues de Platon montrent souvent un 
élève hésitant, mais plein de bonne volonté, qui échoue à définir l’essence du Beau, de la 
Vertu, de la Justice, … et ne fait que proposer des exemples. 
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dénombrer Sp arêtes, mais en procédant ainsi on compte chacune des arêtes 
deux fois (une fois pour chacun de ses deux sommets), donc Sp = 2A. On est 
ainsi amené à résoudre le système 


S—-A+F=—2 
Fq=2A 
Sp = 2A. 


On obtient 


4 2 4 
CR RE Fo Re 
2p + 2q — pq 2p + 2q — pq 2p + 2q — pq 


On est alors amené à chercher tous les couples d’entiers (p, q) qui vérifient les 
trois inégalités 2p + 2q — pq > 0, p > 3 et q > 3. La première condition, qui 
s'écrit 
(p—2)(a —2) <4, 

impose à p et q d’être petits, et nous donne seulement 5 couples d’entiers 
possibles : (3,3), (3,4), (3,5), (4,3) et (5,3). On vérifie alors que chacun de 
ces couples permet le calcul d’un triplet (S, À, F) correspondant à l’un des 
cinq polyèdres platoniciens de la FIG. 4.5. m 
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Chapitre 5 


Outils élémentaires de 
l’analyse 


Outils élémentaires de l’analyse. 
(Robert Rolland!) 


Résumé : L'analyse est un secteur très large de l’activité ma- 
thématique. Développée à partir du X VTT siècle, elle à été essen- 
tiellement centrée sur le calcul infinitésimal jusqu’à la fin du X1X° 
siècle. Cette partie s'occupe des nombres et des fonctions en tant 
que tels, des bonnes approximations de ces objets et des outils de 
dérivation et d'intégration qui pemettent d'opérer sur eux et même 
éventuellement de les définir. 


À partir du X X° siècle, l’analyse fonctionnelle, qui considère qu’une 
fonction est un point d’un ensemble de fonctions, avec tous les as- 
pects géométriques qui s’y rattachent, s’est developpée, principa- 
lement pour la résolution des problèmes aux limites des équations 
différentielles et intégrales. 

Nous présentons ici un texte libre qui donne quelques idées élé- 
mentaires sur les outils de base et leurs utilisations dans le cadre 
du calcul infinitésimal. Nous insistons sur l’emploi simultané de 
techniques différentielles et de techniques intégrales, le tout relié 
bien entendu par le théorème fondamental du calcul différentiel et 
intégral. 

L’aspect analyse fonctionnelle n’est pas abordé, tout au moins 
comme objet central d'étude. 


l'Institut de Mathématiques de Luminy, robert.rolland@acrypta.fr. 
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5.1 Introduction 


Dans ces notes, nous nous préoccupons d’une partie particulière de l’analyse, 
le calcul infinitésimal. Celui-ci, qui s’appuie sur les outils classiques que 
sont la dérivation et l’intégration, c’est-à-dire sur le calcul différentiel et le 
calcul intégral, se préoccupe essentiellement d'approcher des nombres et des 
fonctions. En reprenant une formule employée par Jean Dieudonné dans son 
livre Calcul infinitésimal, le calcul infinitésimal peut se résumer en trois mots : 
majorer, minorer, approcher. 


Au début du X X° siècle, lors du Congrés International de Mathématiques de 
1897, Jacques Hadamard énonce clairement qu’il faut considérer les fonc- 
tions comme des points dans des ensembles de fonctions. Ceci est 
un constat de l’état de la recherche en analyse à cette époque et des direc- 
tions qu’elle prend alors. Désormais, va se développer, avec en vue l’étude des 
équations intégrales et des problèmes aux limites pour les équations différen- 
tielles, la théorie des espaces fonctionnels, mettant l’accent sur une géométrie 
des espaces de dimension infinie. On assiste là, au développement de l’ana- 
lyse fonctionnelle. Nous ne parlerons pas de cet aspect, tout au moins en 
tant que théorie, nous contentant ici d'exprimer les résultats anciens du calcul 
infinitésimal, quand ceci s’impose, dans le cadre de l’analyse actuelle. 


En définitive, nous parlerons de nombres, fonctions, suites, séries, dérivées 
et intégrales en relation avec des problèmes d’approximation et d’interpola- 
tion. Nous évaluerons des différences, à l’aide de majorations, minorations, 
des ordres de grandeur, nous étudierons des comportements asymptotiques. 


Le texte que nous proposons, n’est pas un cours suivi de calcul infinitésimal, 
mais regroupe plutôt quelques notes un peu disparates, écrites au fil de la 
plume, qui soulignent quelques idées de base, agrémentées d’exemples, qui me 
semblent importantes pour celui qui doit aborder des exercices et problèmes, 
ou préparer des cours sur ce sujet. 


De ce fait, ce document n’a bien entendu pas vocation à être exhaustif, ni à 
aborder des résultats fins d'analyse. Pour tout cela, le lecteur pourra se référer 
aux nombreux cours de « Calculus » disponibles. 


5.2 Dichotomie 


Je ne voudrais pas commencer une présentation des outils et des méthodes 
élémentaires de l’analyse, sans citer le plus simple d’entre eux : la dichotomie. 
C’est un moyen performant pour encadrer des nombres, notamment des solu- 
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tions d'équations du type f(x) = 0, qui s'apparente aux stratégies employées 
en informatique sous le nom de « diviser pour régner ». 


Nous partons d’une équation : 
J(æ) = 0, 


où f est une fonction continue, dont nous supposons que nous avons isolé 
le zéro c que nous voulons calculer. C’est-à-dire que nous avons trouvé un 
intervalle [a,b] tel que : 


c €]a,b!|, 
Væ € [a,b]\ {c}, f(x) À 0. 
Nous supposerons en outre que f change de signe en c , donc que : 


fa) f(b) < 0. 


La méthode de calcul de c par dichotomie est très simple : on coupe l’intervalle 
sur lequel on travaille en deux et on teste sur lequel des deux sous-intervalles 
obtenus se trouve c. On réitère ensuite le procédé à partir du sous-intervalle 
déterminé. Après n itérations, on localise le nombre c sur un intervalle de 
longueur (b — a)/2”. Voici les détails : 


On fixe € > 0, 
A:=a; 
B :=b; 
E:=e; 
tant que B—-A>E faire 
C:=(A+8B)/2; 


si f(C) = 0 alors 
retourner C : 
sortir ; 
finsi ; 
si f(A)f(C) < 0 alors 
B:=;C: 
sinon 
A = C; 
finsi ; 
fintq ; 
retourner C : 


Cette méthode ne s’applique pas lorsque f s’annule sans changer de signe, ou 
alors s’annule en des points si proches, qu’il n’est pas possible, numériquement, 
d'isoler un zéro. 
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5.3 Inégalité des accroissements finis 


Soit f une fonction définie sur un intervalle (a,b). Devoir évaluer une quan- 
tité du type |f(x) — f(y)| est un problème très fréquent, notamment lors des 
calculs d'erreurs en physique. Un cas très favorable est celui d’une fonction 
K-lipschitzienne. 


Définition 5.1 Soit K > O0 une constante. Nous dirons que la fonction f 
définie sur (a,b) est K-lipschitzienne, si pour tout x et tout y de l’intervalle 
(a,b) on a la majoration : 


Lf(æ) — F(u) < Klx — y. 


Nous dirons que f est lipschitzienne, s'il existe une constante K° > 0 telle 
que f soit K-lipschitzienne. On dira aussi : f est lipschitzienne de rapport K. 


Quand on arrive à montrer qu’une fonction est lipschitzienne, il en découle 
de bonnes propriétés. En effet la fonction est alors uniformément continue sur 
(a, b). 

Obtenir de telles majorations, tout au moins sur une partie de R, peut se faire 
facilement par calcul algébrique lorsque la fonction s’exprime elle même sim- 
plement sous forme algébrique. Par exemple si f est une fonction polynomiale, 
ou une fraction rationnelle, ou une racine carrée. 


Exemple 1 : la fonction f(x) = x? est lipschitzienne sur [0,1]. En effet : 


fœ) — fu) = 2 y = (x y)(x + y). 


Donc : 
FC) — f(y)l < 2x — yl. 
Cette fonction n’est pas lipschitzienne sur [0,+co[. D'ailleurs une fonction 


uniformément continue sur [0,+c[ est majorée par une fonction affine, ce qui 
n’est pas le cas de x°. 


Exemple 2 : la fonction f(x) — _ est lipschitzienne sur [—1,1/2]. En 
effet : ss ds 
“4 y y—x 
en _ D _ — 
Donc : | | 
y—%x 
LfCx) — f(y)l < 
[Ge —1)(y —1)] 
d’où : 


5.3. INÉGALITÉ DES ACCROISSEMENTS FINIS 167 


Exemple 3 : la fonction f(x) — ,/x est lipschitzienne sur [1/2, 1]. En effet : 
T—Y 
f(x) — f{y) = Vz - y = ———<— 
Pr Var 


Donc : 
Je) SI < le ul 


Il n’en est pas de même quand f est une fonction plus compliquée. Dans ce 
dernier cas il faut mettre en place un outil plus complexe : le théorème (ou 
inégalité) des accroissements finis. 

Une version immédiate de ce théorème se démontre avec le théorème fonda- 
mental du calcul différentiel et intégral, dans le cas d’une bonne fonction f 
dérivable sur un segment {a, b] et dont la dérivée est intégrable (pour nous ce 
sera ici au sens de Riemann, donc en particulier on supposera f’(t) bornée sur 
[a, b]). On à alors pour tout x et tout y de [a, b] : 


y 
f@) - J() = | f'(b)dt. (5.1) 
En posant : 
M — supieta ul f'(t)|dé, 


on obtient la majoration uniforme : 


Lf(æ) — f(y) < Mix — yl. 


La forme plus générale suivante, a une expression géométrique très simple 
et très intuitive. 


Théorème 5.1 (Théorème des accroissements finis) Soit f une fonction 
continue sur le segment [a, b|, dérivable sur l'intervalle ouvert ]a,b[. Alors ül 
existe un point c EJa, b| tel que : 


f@) — f(a) = f(c)(b— a). 


Autrement dit il existe un point c intérieur au segment où la tangente est 
parallèle à la corde joignant l’origine à l’extrémité de l’arc considéré (cf. figure 
DL): 


Preuve. Il suffit de se ramener au cas où f(a) — f(b), cas dans lequel on doit 
montrer l'existence d’un point c intérieur tel que f'(c) = 0. Dans ce cas le 
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F1G. 5.1 —- Théorème des acroissements finis 


théorème s’appelle théorème de Rolle. Puis on applique le théorème de Rolle 


à la fonction : / 
ge) = fa) - 100, 

qui en vérifie bien les hypothèses, ce qui nous donne directement le résultat. 
Supposons donc en outre, f(a) = f(b) et montrons l'existence d’un point c tel 
que f’(c) = 0. Si la fonction est nulle sur {a, b] le résultat a lieu. Sinon, il existe 
un point intérieur c où la fonction atteint un extremum (f est continue sur 
un compact). Supposons par exemple qu’au point c la fonction soit maximale. 
Alors pour tout a < x <c, on a 


JG) — f(o) 


TX —C 


> 0 


— ? 


ce qui implique, par passage à la limite en c, que f'(c) > 0 (par hypothèse la 
dérivée existe en tout point intérieur). Par ailleurs, pour tout c < x <bon a 


JG) — f(o) 


TX —C 


0; 


ce qui implique cette fois que f'(c) < 0. On en déduit que f’(c) = 0. 
Cette forme géométrique conduit directement à l’inégalité des accroissements 


finis, dans le cas où on peut encadrer la dérivée f” sur l’ouvert ]a, b|. 


Théorème 5.2 (Inégalité des accroissements finis) Soit f une fonction 
continue sur un segment [a, b] dérivable sur l’ouvert ]a, b[ et telle qu'il existe 
deux constantes M > m telles que pour tout x €]a, b[ on ait : 


m< f'(x) < M. 
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Alors, 
m(b— a) £ f(b) — f(a) < M(b— a). 


En posant K = max(|m|,|M|), on obtient : 
| FC) — f(a)| < KÏb— al. 


En conclusion, remarquons dès à présent, que lorsqu’on peut employer l’outil 
très puissant qu'est l'intégration (voir équation (5.1)), on obtient très rapide- 
ment et à moindre frais une majoration de | f(y) — f(x)|. Cependant, dans des 
cas plus particuliers (et certainement plus rares), on doit rester dans le cadre 
du calcul différentiel sans passer par le calcul intégral. C’est le cas ici, pour la 
preuve du théorème des accroissements finis (voir le théorème 5.1) supposant 
uniquement l’existence de la dérivée sur l’ouvert ]a,b[. Si on sort du cadre de 
l'interprétation géométrique (qui a tout de même ici un intérêt certain) pour 
se plonger dans le calcul infinitésimal, il arrive un moment où il faut bien ma- 
jorer. Et là, la marge de généralité, que semble avoir la fonction f, se réduit 
notablement. Nous retrouverons cette même question quand nous verrons la 
formule de Taylor. 


5.4 Point fixe, méthode de Newton 


5.4.1 Approximations successives, point fixe 


Avant de présenter la méthode de Newton, disons quelques mots sur la mé- 
thode générale des approximations successives. Soit f une fonction de classe C1 
définie sur un intervalle [a, b] à valeurs dans l'intervalle [a, b]. Soit uo € [a, b]. 
On définit alors par récurrence la suite de terme général u; en posant pour 
tout à > 1 u; — f(u;_1). On étudie la convergence de cette suite. Nous allons 
montrer que sous certaines conditions on peut affirmer qu’il existe un point 
fixe pour f, c’est-à-dire une solution de l’équation f(x) = x (cf. figure 5.2). 
Donnons tout d’abord le théorème général suivant, qui met en avant la notion 
de fonction lipschitzienne dont nous avons déjà parlé : 


Théorème 5.3 (Théorème du point fixe) Soit f une application d’un seg- 
ment [a,b] dans lui-même. On suppose que pour tout n > 1 la fonction fn 
obtenue en itérant n fois f : 


fn=fofo..of 


est lipschitzienne de rapport kn. On suppose en outre que la série D, kn est 
convergente. Alors la fonction f admet un point fire c et un seul. Pour tout 
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XO 


F1G. 5.2 - Théorème du point fixe 


point xo € [a, b] la suite (ïn)n>o définie par récurrence à partir de ce point x 
en itérant f : 


Tn — FA) = fn(xo); 


converge vers le point fire c. 


Preuve. Soient m > n deux indices. On peut écrire successivement : 


m—1 
[Lim — Tn| < D ltir1 — til, 


i=n 


m—1 
[Cm — Tnl < ÿ kilt1 — xo|, 
1—n 


Comme la série de terme général k; est convergente, cette inégalité prouve que 
la suite (&n)n>0 est une suite de Cauchy, donc converge vers un point c du 
segment [a, b]. La fonction f étant continue (puisque lipschitzienne), on conclut 
que c = f(c). Ce point est l’unique point fixe. En effet soit d un point fixe, et 
soit n un indice tel que k» < 1. alors |fn(c) — fn(d)| < kn|c — d|, puisque fn 
est k,-lipschitzienne, et aussi |f,(c) — fn(d)| = |c — d| puisque c et d sont des 
points fixes de f (et donc de f,). On en déduit que : 


le — d| £ knlc— d}, 


5.4. POINT FIXE, MÉTHODE DE NEWTON 171 


avec 0 < k, < 1, donc d=c.m 


Un cas important d'application de de ce théorème est le cas où f est lipschit- 
zienne de rapport 4 < 1. En effet dans ce cas, f, est lipschizienne de rapport k, 
avec k, < k”, et la série 97, kn est convergente. 


Corollaire 5.1 Soit f une application d’un segment [a, b] dans lui-même. On 
suppose que la fonction f est lipschitzienne de rapport k < 1. Alors la fonction 
f admet un point fixe c et un seul. Pour tout point xo € [a, b] la suite (ïn)n>0 
définie par récurrence à partir de ce point xo en itérant f : 


Tn — f(tn-1), 
converge vers le point fire c. 


En pratique, on montre souvent qu’une fonction est lipschitzienne de rapport k 
à l’aide du théorème des accroissements finis. On a donc le corollaire utile 
suivant : 


Corollaire 5.2 Soit f une application continue d’un segment [a, b] dans lui- 
même. Supposons que f soit dérivable sur |a,b[ et de dérivée bornée par un 
nombre k < 1, c’est-à-dire : 


sup |f'(x)| = k <1, 
x€]a,b| 


alors la fonction f(x) admet un point fixe xo et un seul sur l'intervalle [a, b]. 
La suite (u;); définie précédemment converge vers le point fixe to. 


Preuve. Le théorème des accroissements finis montre que f est lipschitzienne 
de rapport k = sup |f'(æ)l. Le corollaire précédent permet de conclure. 
= 


5.4.2 Quelques exemples 


Dans le premier exemple que nous allons donner, nos emploierons deux mé- 
thodes : nous ferons tout d’abord un calcul à la main, puis nous utiliserons 
directement le théorème précédent. Nous suggérons au lecteur de calquer ce 
shéma pour les autres exemples. 


Exemple 1 : calcul du sinus et du cosinus de 1° par réinjection 
> Présentation de l’exemple 


Les propriétés géométriques des lignes trigonométriques permettent de calcu- 
ler facilement sin(r/6), sin(r/4), sin(r/3), sin(r/5) ainsi évidemment que les 
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cosinus des mêmes angles. En utilisant la formule qui donne le sinus d’une 
différence on trouve sin(r/30), en utilisant la formule qui donne le sinus de 
l’arc moitié on obtient sin(r/60). On a donc une table donnant les sinus (et 
les cosinus) de 3° en 3°. Il faudrait donc calculer sin(r/180) pour avoir une 
table trigonométrique donnant les lignes de tous les angles en degré entier. On 
utilise alors la formule : 


sin(3x) = 3sin(x) — 4sin°(x) (5.2) 
qu'on va appliquer ici avec x = 7/180. On cherche alors à résoudre cette 
équation connaissant la valeur a = sin(3x). L'équation se ramène à : 

, li 
sin(x) = 3 sin”(x) + a). 
Donc si on pose : 
1 
fu) = z(4u° + a), 


le nombre sin(r/180) est solution de l’équation : 


J(u) = u, 
c’est-à-dire est un point fixe de f. 


» Calcul à la main 
Pour calculer cette solution on part d’une valeur approchée de la solution wo, 
par exemple uo = 0, et on calcule u1 = f(uo). La valeur u est réinjectée dans 
le second membre pour calculer une nouvelle approximation u2 = f(u1), puis 
plus généralement, par récurrence : 


Un — f(un-1). 


Théorème 5.4 La suite de terme général u, converge vers la valeur cherchée 
sin(r/180). 


Preuve. La fonction f a pour dérivée f’ (u) = 4u?, donc elle est croissante. 
On a par ailleurs : 


u = f(0)=2 20 
et aussi : à à 
a a 
Ne AE 

f(G) À | nt). 
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donc : 


On conclut que l’image par f de l’intervalle [0, a/2] est incluse dans l'intervalle 
[0, a/2], autrement dit, restreinte à l'intervalle [0, a/2], f est une application 
de [0, a/2] dans lui-même et cette application est croissante. 

Comme up = 0, u = f(uo) > wo, on à aussi f(u1) > f(uo), c’est-à-dire 
que u2 > u et par récurrence un > Un-1. La suite de terme général u, est 
croissante, elle est majorée par a/2, elle converge donc vers une limite b. Cette 
limite vérifie b — f(b). L'étude de la fonction g(u) = u — f(u) sur l’intervalle 
[0, a/2] nous montre que l'équation g(u) = 0 à au plus une solution dans cet 
intervalle (en effet g(u) est strictement croissante sur cet intervalle). Donc le b 
trouvé comme limite de la suite de terme général u, est l’unique solution de 
l'équation u = f(u) sur l’intervalle [0, a/2]. Comme on sait que sin(r/180), qui 
est dans l’intervalle en question, est solution de cette équation, pas de doute, 
b = sin(r/180). m 

» Application du théorème général 


Il suffit de voir que sur l'intervalle [0, a/2] la dérivée de la fonction f vérifie : 
|[f' (x)| Lai, 


Le corollaire 5.2 permet de conclure. 


» Qualité de l’approximation 


On peut aussi évaluer la qualité de approximation, Sur l'intervalle [0, a/2] : 
(FES a. 
On a alors en utilisant l'inégalité des accroissements finis et le fait que b = f(b) : 
b— un] = |f(b) — f(un-1)| < a°1b — uni], 
et en réitérant le procédé, 
b— un| < (a°)"1b — uol, 
et en majorant |[b — uo| par la longueur de l'intervalle : 


a2ti 


1b — un| < 


(Ceci revient à refaire la démonstration du théorème général.) 
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Exemple 2 : calcul de l’inverse d’un nombre. 
> Présentation de l’exemple 


Soit a un nombre réel que nous supposerons > 0 dont nous voulons calculer 
l'inverse 1/a. La méthode que nous présentons, et qui est implémentée dans 
certaines calculatrices et certains langages de programmation, est très perfor- 
mante. C’est la méthode de Newton, développée pour le cas particulier qui 
nous préoccupe. 

Introduisons la fonction : 


Cherchons les solutions de l’équation : 
= (6) (5.3) 


c’est-à-dire de : 
æ(1 — ax) = 0. (5.4) 


Les solutions sont 0 et 1/a. Nous allons essayer d’approcher la solution 1/a. 
L'idée est de partir d’une valeur approchée uo > 0 de 1/a, de calculer le premier 
terme u1 = F(uo), de réinjecter u1 dans la partie droite de l’équation 5.3 pour 
obtenir u2 = F(u;) et plus généralement par récurrence u, = F(un-_1). 
Notons 1 l'intervalle ouvert ]0,2/al. 


Théorème 5.5 Soit uo € I. Alors la suite définie par le premier terme uo et 
la relation de récurrence pour n > 1 


Un = F(üun-1), 
converge vers 1/à. 
Preuve. La dérivée de F(x) sur lintervalle Z est donnée par : 
F'(x) = 2(1 — ax). 


Sur l’intervalle J, la fonction est positive et atteint son maximum en x = 1/a. 
En ce point la valeur de la fonction est 1/a. On peut donc conclure que l’image 
de l'intervalle J est incluse dans 7. Remarquons aussi que sur l'intervalle ]0, 1/a] 
la fonction F(x) est strictement croissante. Si up € 1 alors 0 < F(uo) < 1/a. 
Posons ensuite u1 = F(uo) et par récurrence un = F(un-1). Tous les termes 
wi, U2,--- sont donc dans l'intervalle ]0, 1/a]. De ce fait, aun < 1, si bien que 
(2 — au) > 1 et donc 


ünit = Un(2 = Un) > Un: 
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La suite (un )n>1 est croissante, majorée par 1/a, donc converge vers une limite 
0 <b < 1/a qui vérifie b = b(2 — ab). 
Cette limite est donc le point 1/a de F.m 


On peut étudier aussi la qualité de l’approximation obtenue. Pour cela on 
suppose qu’on parte d’une valeur uo telle que 


1 
0 < up < —. 
a 


Dans ces conditions on sait que toutes les valeurs uw, sont aussi dans cet inter- 
valle. Alors on a successivement : 


1 — au = 1 — aun-1(2 — aun_1), 


2, 2 
1 — aun = 1 — 2aus-1 + aus _1, 


1 — aun = (1 — Aun_1)?, 
1 — aun = (1 — auo)””. 
On obtient donc : ï : 
Un = (1 — aug)". 
a 


Posons & = 1 — aug. Compte tenu des conditions sur la valeur initiale uo le 
nombre @ vérifie 0 < & < 1. La suite u, qui vérifie : 


a donc une convergence quadratique vers 1/a. 
Lors d’une implémentation effective, le problème du choix du point de départ 
se pose. On commence par écrire a sous la forme : 


Q@ = 10 


où 1 < c < 10 et où k est un entier relatif. Ceci permet de se ramener à calculer 
l’inverse d’un nombre compris entre 1 et 10. Ceci étant fait, on peut supposer 
désormais que 

1<a<10. 


Choisissons u9 de la façon suivante : 
1. si 1 < a < 2 alors ug = 0.5, 
2. si 2< a < 3 alors uo = 0.8, 
3. si 3 < a < 5 alors uo = 0.2, 
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4. si 5 < a < 10 alors up = 0.1. 


Ce choix respecte la condition uo < 1/a, et de plus aug > 0.5, par conséquent 
1 — aug < 0.5. Ces choix étant faits on obtient puisque 1/a < 1 et à < 1/2 : 


< 


On peut se demander à propos de l’exemple précédent pourquoi la convergence 
est si rapide. C’est ce que nous allons essayer d’expliquer maintenant. 

On peut déjà, compte tenu de la situation, penser que la convergence va être 
rapide. En effet compte tenu de l’inégalité des acroïissements finis : 


| 1 


— — Un 
a 


5.4.3 La méthode de Newton 


m5 = Fm) P (à) <k 


a 


Un—1 — — , 
(#7 


où k est un majorant de F'(x) sur l'intervalle considéré. Donc : 


1 
Cr EL 
(42 


| 
UO — — |, 

a 
si bien que si k < 1 la suite converge. Mais ici, la dérivée est nulle au point fixe, 
donc, on peut s’attendre à une amélioration de la rapidité d’approximation 
lorsqu'on se rapproche du point fixe. On a vu en fait que l’approximation est 
quadratique. 
Généralisons cette méthode. Soit f(x) une fonction sur un intervalle Z — {a, b] 
et ayant sur cet intervalle un seul zéro c. On suppose que f'(x) ne s’annule 
pas sur Î. 

Fe 
J'(æ) 

Alors c est le seul point fixe de F(x) sur l'intervalle J. 


Fe) - SOS") 


rm 


Donc F’(c) = 0. On se retrouve dans la situation favorable précédente. 
Remarquons que cette construction a une interprétation géométrique simple : 
Il s’agit ici de remplacer la fonction f dont on cherche un zéro par sa tangente 
en un point voisin du zéro cherché (cf. figure 5.4). 


Ainsi, à partir d’un point up proche de la solution xo de l’équation 


f(x) = 0 
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F1G. 5.3 — Approximation de 1/a 


(qu’on supposera unique, tout au moins dans un intervalle adapté), on construit 
la tangente à la courbe y = f(x) au point (uo, f(uo)). Cette tangente coupe 
l’axe des abscisses au point u1. On itère cette construction à partir de la va- 
leur u1 pour obtenir le point u2. Le calcul de l’équation de la tangente au point 
d’abscisse x et de son intersection avec l’axe des x montre que si on introduit : 


J(x) 


ee 


alors on peut écrire : 
= Elo) és Ploibre sd = rl) 


On vérifie imédiatement que x0 est point fixe de la fonction F(x). De plus 
si on suppose la fonction f de classe C? par exemple et si on suppose que 
la dérivée f’ de f ne s’annule pas, alors F(x) est dérivable et sa dérivée est 
nulle au point +9. [l y aura donc un voisinage fermé de ce point fixe, pas 
nécessairement simple à déterminer effectivement, dans lequel la théorie du 
paragraphe précédent s’applique. De plus, comme la dérivée de F sera proche 
de zéro, on peut espérer une bonne convergence de la suite (u»)n, d'autant 
plus rapide qu’on va se rapprocher du point fixe. 
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fui uQ 


X 


F1G. 5.4 —- Méthode de Newton 


Comme F(c) — c = 0 on conclut que A(c) = 0. Comme F'(c) = 0 on conclut 
que A’(c) = 0. Si par exemple A(x) est un polynôme ça veut dire qu’il s’écrit : 


A(x) = (x — a) B(x), 


où B(x) est un polynôme et donc la convergence est quadratique. Nous verrons 
(application de la formule de Taylor) que ceci a lieu pour des fonctions plus 
générales. 


Exemple 3 : Considérons la fonction f(x) = x? — 2. En nous restreignant 
à æ > 0, nous allons déterminer la solution positive de l’équation æ? — 2, 
c’est-à-dire x = V2. Introduisons donc, comme nous l'indique la méthode de 
Newton, la fonction : 


2 
T° —:2 æ 1 1! 2 

F —= — — _— — = _ 3 
Gi= zx 7x & . (+2) 


On voit que par exemple F([1,2]) € [1,2] et sur cet intervalle la dérivée de 
F(x) est en valeur absolue majorée par 1/2. Donc le théorème du point fixe 
s'applique sur cet intervalle. Nous avons successivement : 


; (u " =) = VE = Fur) = F(VD = 3 (a + (VRP - an), 
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c’est-à-dire : 


1 2 
lun+1 — V2] < 2 (un — V2) . 


La convergence est donc quadratique. 


Exemple 4 : Prenons f(x) = x? — x — 1 et regardons ce qu’il se passe sur 


l'intervalle [1,2]. On est alors amené à introduire : 


2 
x” +1 
FG)= 


Exemple 5 : On peut reprendre le calcul de b = sin(r/180) connaissant 
a = sin(r/60). Nous avions utilisé la fonction f = 1/3(4x°+a) pour définir par 
récurrence la suite un — f(un-1) qui convergeait vers le point fixe b — f(b). 
Hélas, au point b, la valeur de la dérivée f/(b) n’est pas nulle, si bien que 
la convergence n’est peut être pas aussi rapide qu’elle pourrait l’être avec la 
méthode de Newton. Pour appliquer cette méthode, nous remarquons que nous 
cherchons le zéro de la fonction h(x) = f(x) — x. Conformément aux calculs 
précédent, nous introduisons la fonction : 


h(x) 
Tous calculs faits, on obtient : 
= 8x° — a 
NU om 3 


La suite uo = 0, un = g(un-1) converge alors plus vite que précédemment vers 
la valeur cherchée b = sin(r/180). Une expérimentation avec un système de 
calcul confirme ce comportement. En partant de uo = 0, la première itération, 
u1 = g(uo), donne 4 décimales exactes, la deuxième, u2 = g(u1), donne 11 
décimales exactes. 


5.5 Intégration, outils de base 


L'intégrale (quand elle existe), est un outil régularisant. Il effectue une moyenne 
et gomme un certain nombre d’irrégularités de la fonction qu’on intègre. Pre- 
nons par exemple la fonction en escalier définie sur [0,1] par : 


Ü -S0<m< 172 
Ï(x) = 
1 SLDELS A 
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Cette fonction f a un point de discontinuité en 1/2 et peut être intégrée : 


gta) = | ro | 1/2 s1/2<æ&<1. 


La fonction g(x) est continue sur [0,1]. Mais g(x) n’est pas dérivable (au point 
1/2). 

Remarquons que la fonction f n’a pas de primitive sur [ab]. Ce n’est pas 
une dérivée. D'ailleurs on peut montrer qu’une dérivée vérifie le théorème des 
valeurs intermédiaires?, ce qui n’est pas le cas de f ici : 


Théorème 5.6 Soit f une fonction définie sur un intervalle (a,b) qui est 
une dérivée. Soient a et 5 deux points de (a,b). Alors f(x) prend toute valeur 
comprise entre f(a) et f(B). 


5.5.1 Un problème de raccord 


On considère sur l'intervalle [—1,1] la fonction paire f définie sur [0,1] par 
f(x) = 1 — x. On considère les points P et Q de coordonnées respectives 
(—h, f(h)), (h, f(h)) où 0 < h < 1. On cherche un arc de parabole qui se 
raccorde en ces deux points en étant tangent aux deux droites constituant la 
courbe représentative de f. La dérivée de la fonction parabolique sur [—k, h] est 
donc g'(x) = —x/h (polynôme du premier degré qui vaut 1 en —h et —1 en h). 
Donc g(x) = —x?/2h + C. La constante est donnée par g(h) = f(h) =1—h, 
ce qui donne C = 1 — h/2. En définitive : 
2 h 


gG)= +1 


Bien entendu on aurait pu directement écrire les conditions sur g (g polynôme 
du second degré, g/ (—h) = 1, g (h) — —1), mais cette méthode très simple qui 
consiste à déterminer g à partir de sa dérivée est intéressante. 
5.5.2 Intégration des relations de comparaison 
L'intégration se comporte bien vis à vis des opérations de comparaisons clas- 
siques : 

> Inégalités 


Théorème 5.7 Si f et g sont des fonctions intégrables sur [a, b] et si f < g, 
alors ji f(t)dt < [° att)at. Ce résultat persiste pour les intégrales généralisées. 


?I1 s’agit du lemme de Darboux (voir lemme 16 de "L'épreuve d’exposé au CAPES ma- 
thématiques, vol. IV", de D.-J. Mercier). 
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»> Comportement asymptotique : cas de la divergence 


Regardons maintenant ce qui se passe du point de vue des comparaisons 
asymptotiques des intégrales généralisées. On considèrera qu’on regarde le 
comportement au voisinage de +oo (mais ce pourrait être au voisinage d’un 
point a). On utilise les notations de Landau o(g) et O(g) ainsi que l’équiva- 
lence +. 


Théorème 5.8 Soit g une fonction continue > 0 sur [a, +oo![ telle que 


+00 
| g(t)dt = +00. 


Soit f une fonction continue sur [a, +. 


(1) Si f = O(g) alors 


f(bjdt = O (faut) 


isa 
j fljdé= 0 ( | : 107) 


’ | f(bdt = |. | gtbdt. 


> Comportement asymptotique : cas de la convergence 


(3) Si f + g alors 


Théorème 5.9 Soit g une fonction continue > 0 sur [a, +oo![ telle que 


+00 
;. g(t)dt < +oo. 


Soit f une fonction continue sur [a, +. 


(1) Si f = O(g) alors 
1 f(é)dt = O ( | got) 


A 


(2) Si f = o(g) alors 


| be, ( | di got) 
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(3) Si f + g alors 


+00 +00 
F(bdt = | g(t)dt. 
DA UA 
Ces divers résultats permettent, en collaboration avec l'intégration par partie 
de déterminer des comportements asymptotiques pour diverses intégrales. On 
verra des exemples dans la section consacrée à l’intégration par partie. 


5.5.3 Calcul du sinus et du cosinus de 1° par une approxima- 
tion polynomiale 


On va prendre ici pour valeur approchée du sinus au voisinage de 0 le poly- 
nôme : 
4 
P(x) = x -—. 
(r)=x- © 


Compte tenu du problème posé on prendra x > 0. 


Pour évaluer la qualité de cette approximation nous allons partir de l’inégalité 
triviale 
cos(x) < 1. 


Par conservation des inégalités par intégration sur un intervalle [a, b] où b > a, 


on a donc : > ; 
1. cos(t) dt < | dt, 
0 0 


sin(x) < æ. 


c’est-à-dire : 


En réappliquant cette méthode on obtient maintenant : 


[snwba< | x dt, 
0 0 


x? 


É= ee 
cos(x) < A 


ou encore : 


et en conséquence l’encadrement suivant : 


2 
1- ra < cos(x) < 1. 


On obtient alors successivement, toujours par intégration les encadrements 


suivants : : 


T : 
rs snleh T 
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x? 2e 
Se DRE Me 
dl 7 < cos(x) <1 5 + > 
3 3 5 
œ É 
Se pa, 
“ sin(x) < x G + 125 
Ceci montre en particulier que : 
ab 
0 <si — P(x) < —. 
< sin(x) (x) < 120 


Appliqué au cas où x = 7/180, on obtient : 


T T 
Pit VOLE) BR) UE) et line 
0<sn() Fe A 


5.6 Quelques classes habituelles de fonctions 


Quand on fait de l’analyse on essaie le plus possible de "rendre cohérents" 
les systèmes avec lesquels on travaille. Précisons un peu ce que j'entend par 
là. On est souvent confronté au problème suivant : on a un ensemble d’objets 
mathématiques (par exemple des fonctions continues sur un segment {[a, b]). 
On à un outil qui s’applique à ces objets (par exemple l'intégrale sur le seg- 
ment [a,b]). Enfin on à un mode de convergence (par exemple la convergence 
uniforme sur [a,b]). La question est : l’outil agit il de manière stable vis à 
vis de la convergence dans cet ensemble ? (Par exemple : soit f, une suite de 
fonctions continues sur {a,b] qui converge uniformément vers f. La suite des 
intégrales des f, converge-t-elle vers l’intégrale de f ?). Dans certains cas ceci 
n’a pas lieu, et en fait les raisons du dysfonctionnement peuvent être multiples. 
Prenons l'exemple de l’espace des fonctions continues sur un segment [a, b], et 
la convergence simple. 

1. Le premier obstacle est que cet espace n’est pas stable pour la convergence 
simple. 

Exemple 1 : on considère la suite de fonctions (fh)1=0 définies sur [0,1] 
par : 


nu si x € [0, À] 
fa(a) = { 0 sinon . 


Cette suite de fonctions continues converge simplement vers la fonction dis- 


1 six =0 
ro! 


continue : 


0 sinon . 


2. On peut alors penser à considérer l’espace des fonctions intégrales au sens 
de Riemann sur {a, b]. Hélas, il n’est pas stable non plus pour la convergence 
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simple : On peut trouver une suite de fonctions intégrables au sens de Riemann, 
qui converge simplement vers une fonction bornée, qui n’est pas intégrable au 
sens de Riemann. Pour cela considérons la suite de fonctions f,, définies sur 
[0,1] par : 


k 
1 … _ l < < n)! 
nt = | si æ en, 


0 sinon . 


Cette suite converge simplement vers la fonction de Dirichlet : 


fa) = { 1 sixe(0,1]NQ 


7 | O0 sinon. 


Les fonctions f, sont intégrables (au sens de Riemann), la fonction f ne l’est 
pas. 

D'autre part, rester dans le cadre des fonctions continues et de la convergence 
uniforme est un peu contraignant. Le cadre des fonctions réglées est un bon 
compromis. 


Définition 5.2 Soit f une fonction définie sur un segment [a,b]. La fonc- 
tion f est dite réglée, si en tout point x Ela, b[, elle admet une limite à droite 
et une limite à gauche, et si elle admet une limite à droite en a et une limite 
à gauche en b. 


On doit donner tout de suite une caractérisation très importante des fonctions 
réglées, qui pourrait d’ailleurs servir de définition. 


Théorème 5.10 Une fonction f définie sur un segment [a, b] est réglée, si et 
seulement si elle est limite uniforme de fonctions en escalier. 


Cette caractérisation nous fait comprendre l'intérêt de cette classe lorsqu'on 
travaille avec l’intégrale de Riemann, qui rappelons le, est définie par passage 
à la limite sur des intégrales de fonctions en escalier. 

Les fonctions en escaliers, les fonctions continues, les fonctions monotones sont 
des fonctions réglées. Cette classe est stable pour la convergence uniforme et 
l'intégrale d’une limite de fonctions réglées est la limite des intégrales. 


5.7 L'intégration par partie 


Nous présentons ici un outil très simple mais particulièrement efficace : l’in- 
tégration par partie. À son propos, je citerais Roger Godement qui dans la 
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rubrique Calcul Infinitésimal de l'Encyclopédie Universalis écrit : "[lintégra- 
tion par partie est] très commode pour le calcul pratique des intégrales, mais 
dont l'intérêt est ailleurs lorsqu'on s’occupe de mathématiques". 

Donc, si l’on veut bien laisser de côté le volet anecdotique du calcul exact de 
certaines primitives, il faut comprendre l'intégration par partie comme l’écri- 
ture d’une expression sous forme d’une partie principale (la partie tout inté- 
grée) et d’un reste (la deuxième intégrale) 


1 l'État = tro - f rodtat 
Évidemment, si on espère que la partie 


= | fOg at 


puisse être considérée comme un reste, il faut qu’elle soit négligeable devant 
la partie tout intégrée 


PULIUIrE 


Cette remarque nous indique comment choisir, quand on fait une intégration 
par partie d’un produit de deux fonctions, celle qu’on intègre et celle qu’on 
dérive : celle qu’on dérive est en général celle qui relativement varie peu, de 
manière à obtenir une dérivée petite devant la fonction elle-même. Attention 
ceci ne s'applique pas pour l’utilisation de l'intégration par partie pour des 
calculs de primitives, ni pour l’établissement de formules théoriques où l’on 
veut obtenir une forme particulière pour le terme tout intégré. 

Dans la suite de ce chapitre, nous donnons deux applications très impor- 
tantes de l’intégration par partie : la formule de Taylor et la formule d’Euler- 
Maclaurin. Ces deux formules constituent des outils de base des méthodes 
d’approximation. 


5.7.1 Intégrons dans le bon sens 


Exemple 1. Il s’agit d'évaluer au voisinage de + l'intégrale 


+00 ,—u 
In(x) 


On choisit clairement de dériver la fonction 1/u? et d'intégrer la fonction e-*, 


on obtient ” . 
2 p—U 1 œ p—u 
— du = = —- 2 | — du. 
ls u? æ(In(x))? In(x) uÿ 
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Cette manière de faire permet effectivement d’obtenir un reste négligeable 


devant la partie intégrée. En effet : 


u3 ne 
donc : 
+00 ,—u +00 ,—u 
| — du = 0 | du 
In(x) In(x) 4 
et en conséquence : 
+00 e 1 
Fos 
In(x) U z(n(x)) 


Exemple 2. Dans cet exemple nous cherchons la nature de l’intégrale : 


a sin(x) . 
1 


T 


On étudie donc : . 
/ sin(x 
lim ne), 
A— +00 1 T 
On va faire une intégration par partie, en dérivant la fonction qui varie peu 


au voisinage de + et en intégrant l’autre, c’est-à-dire sin(x). On à donc en 
détaillant un peu l'intégration par partie sur l'intervalle [0, A] : 
1 = 

v' = sin(x) 


A . 
sin(x 
| AU = | 

1 à g d 
La partie principale tend vers cos(1) lorsqu'on fait tendre À vers +0, le reste, 
c’est-à-dire : ” 

cos(x 
— F C pe 
1 T 


est majoré en valeur absolue par une intégrale convergente : 
A A +00 
cos(x 1 
| C lan < | d< | —dx, 
1 " 1 1 Le 


donc constitue une intégrale absolument convergente sur [1, +ool. 
On en conclut que l’intégrale étudiée est convergente. 


cos(x) 
42 
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On peut montrer que l'intégrale étudiée n’est pas absolument convergente en 
étudiant les sommes partielles : 


s, =. EAU] 
1 


g 
7 |: n—1 (kHL)T Les 
5, = | re + >} Bt, (5.5) 
1 k=1 ÀT 
QUE (k+1) 
T [sin(x)| 1 [ | 2 
> = 
Î. œ d 2 (k + DT Jo FLO (k+1)r° 


ce qui prouve que la série qui intervient dans la formule (5.5) est divergente. 


Exemple 3. Dans cet exemple nous cherchons un équivalent au voisinage 
de + de 
1 F «dt 
a M) 
(où a > 1). 
On effectue une intégration par partie, où on dérive 1/In(t) et on intègre 1 : 


Le lol. + / mo 


Comme : 


on à : 


En conséquence : 
j 0 L 
a (ét) In(x) 
Exemple 4 (l’art de se faire enfumer). Il s’agit de calculer 
Le 1. 2? (n(x))dz. 
1 


On a Lo = (eè — 1)/3. 
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» Le piège 


Le piège consiste ici à voir apparaître une formule très simple et à se laisser 


aller à intégrer par partie "à l’envers". C'est-à-dire qu’on va dériver (In(x))? 
et intégrer x?. 
€ 2 
I, — 3 = 3 1p-1. 


Si nous itérons le calcul nous sommes amenés à écrire la formule exacte 


3 L | l 
ne. p pp—1) pin plie 
LE (: ou 9 +... +(-1) + (—1) gi (e 1); 
Hélas, comme à chaque étape on a pris un "reste plus grand que la partie qui 
aurait dû être principale", cette formule est très instable numériquement. En 
effet si on change un peu la valeur initiale /5 en Jo, alors le terme J, calculé 
vérifie 
p! 
Jp D = (1) 35 (do — Do), 
ce qui fait que si Jo À Lo, alors [J, — 1,| — +co. Donc une erreur d’arrondi va 
complètement modifier le calcul. 


» L'intégration dans le bon sens 


Bien sûr, si on intègre dans le bon sens en exhibant une partie principale et 
un reste plus petit que cette partie principale, alors ceci ne se produit plus. 


Intégrons donc BE et dérivons x°. Nous obtenons 


RE. 
FE. HE 


1, 


et cette fois-ci en itérant le calcul on tombe sur une formule stable qui nous 
permet d'écrire tout de suite 
e? 
Dee 
P 


Si on veut pousser le développement plus loin on obtient : 


1 4 1 
I =#(5-2)+e(s). 
: p  p? p? 


Bien sûr la formule de récurrence trouvée est la même que dans le premier 
calcul, écrite différemment. Mais justement ceci nous permet de voir que si 
on à une vision "à l'envers" de l’intégration par partie, alors la suite des calculs 
qu’on est amené naturellement à faire conduit à de mauvaises situations. 
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5.7.2 Conclusion et remarques 


Nous avons vu que l'intégration par partie est un outil puissant pour étudier 
des comportements asymptotiques d’intégrales convergentes ou divergentes en 
considérant la partie tout intégrée comme la partie principale et la deuxième 
intégrale comme un reste. 

D'un autre côté, en analyse il y a un aller-retour pemanent entre des situations 
« discrètes » et des situations « continues ». On approche des fonctions en 
regardant ses valeurs en un nombre fini de points par exemple. Ou bien on 
construit une fonction en interpolant à partir d’un nombre fini de valeurs. On 
associe à une équation différentielle y = f(y) une suite telle que u9 = Yo et 
Un+1—Un = Rf(un), remplaçant ainsi la dérivée par une différence finie (c’est la 
méthode de la tangente d’Euler). En ce qui concerne les intégrales généralisées, 
elles trouvent leur équivalent discret en considérant les séries. On peut donc 
se demander quel est le pendant sur les séries de l’intégration par partie. C’est 
la transformation d’Abel. Considérons la série de terme général a,b,. Posons 
alors Sy = D b; et So = 0. Alors : 


Ÿ_ axbr = dar (Sr = Ska), 
= ar] 
n n n n n—1 
Ÿ_ axbr = Ÿ_ aSk = Ÿ  arS 1 = Ÿ_ ask = Ÿ_ar:158, 
k=1 | ki | k=0 


n n—1 
VS agde = an9n + D Sk(ax — ax+1). 
k=1 k=1 


On peut aussi écrire cette transformation pour un reste partiel : 


n n—1l 
ÿ ORbE = 08 = GR 10m A4 + ÿ Sr(ax = ak+1): 
k=m k=m 


À partir de là et de quelques hypothèses sur les comportements de a, et S,, 
on peut aussi énoncer des résultats sur le comportement asymptotique de la 
série de terme général an bn. 


5.8 La formule de Taylor 


5.8.1 Remarque préliminaire 


Comme nous allons le voir, la formule de Taylor peut être considérée comme 
une généralisation du théorème fondamental du calcul différentiel et intégral 
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qui permet d'écrire lorsque f est dérivable et de dérivée intégrable : 


f@-1@= | | f(bt. 


En intégrant par partie l’intégrale du second membre, puis les intégrales cal- 
culées successivement en itérant le procédé, on obtient la formule de Taylor, 
qui nous permet d'exprimer une fonction comme un polynôme plus un reste. 


5.8.2 Le théorème principal 


Théorème 5.11 Soit f une fonction à valeurs réelles définie sur le segment 
[la —e,a+e] et n +1 fois continument dérivable sur ce segment. Alors pour 
tout point x du segment [a — €, a + €] on peut écrire 

(œ—a)" °(@-i) 


FC) = Fa + ro ++ (0) + EL (pa. 


n! à n! 


Preuve. On utilise une démonstration par récurrence. La formule 


| © fbdt = f(x) — f(a), 


assure que le théorème est vrai pour n = 0. Si on suppose vraie la formule à 
l’ordre n > 0 alors 


. (æ I er) (t)dt = EE mt) 1 GOT yen) (t)dt, 


= ANT __  \n+1l œ ___\n+1 
| (x D FD (pdt = sea) + | re ar, 


ce qui nous donne la formule à l’ordre n +1. 


5.8.3 Obtention d’autres écritures 


J'essaie autant que faire se peut d’exprimer les formules asymptotiques en utili- 
sant des restes intégraux qui donnent des formules exactes et qui conduisent 
assez facilement à des majorations effectives. J’évite au maximum les formules 
faisant intervenir des restes écrits avec des points dont on ne connait pas la 
valeur mais juste une localisation. En général, dans un vrai problème on n’a 
jamais vraiment besoin de ces formules et les formules avec reste intégral ainsi 
que l'outil "intégration par partie" permettent d'obtenir les évaluations dont 
on à besoin. De toutes façons, il ne faut pas oublier que tant qu’on écrit la 
formule avec reste intégral on ne perd rien, toute l’information est là et reste 
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disponible sous une forme commode. Ce n’est pas le cas avec les autres écri- 
tures : formule de Taylor-Lagrange, formule de Taylor-Young, qui toutefois, 
sont difficiles à ommettre dans un cours ou dans une leçon formelle en raison 
de leur poids historique, mais que je ne conseille guère d’utiliser pour majo- 
rer effectivement. [nsistons encore une fois sur le fait que lorsqu'on dispose du 
reste intégral (ou d’un autre type de reste d’ailleurs), la formule n’est utile que 
si on est capable de majorer ce reste et d’obtenir une bonne approximation 
polynomiale de la fonction f au voisinage du point a. 


»> Formule de Taylor-Lagrange 


Cette formule est dans la ligne directe du théorème des accroissements finis 
dans sa version donnée par le théorème 5.1. 


Théorème 5.12 Soit f une fonction de classe C" sur [a, b] et admettant une 
dérivée d'ordre n + 1 dérivable sur ]a,b[. Alors, il existe un point c Ela, b[ tel 
que : 

b— a)" 
f(a) PRE ES (y) + 


n! 


(b _ dj 
(n +1)! 


Cette formule se démontre en restant dans le cadre du calcul différentiel, en 
appliquant la formule des accroissements finis dans sa version donnée par le 
théorème 5.1. C’est une formule globale, qui permet d’avoir une évaluation 
sur tout un intervalle. Remarquons que l’interprétation géométrique qui faisait 
le grand intérêt du théorème des accroissements finis 5.1 a disparu ici. Dans 
la plupart des cas on gagnera à appliquer la formule avec reste intégral. 


Fr (0). 


»> Formule de Taylor-Young 


Cette formule est une formule locale qui permet non pas d’avoir une évaluation 
sur tout un intervalle fixé à l’avance, mais un comportement au voisinage 
d’un point. Elle est destinée à écrire des développements limités et remplit 
parfaitement sa fonction dans ce cas en expédiant tout de suite le reste sous 
la forme voulue. 


Théorème 5.13 Soit f une fonction de classe C” sur un intervalle TI, et a 
un point de I. On suppose que f admet une dérivée d'ordre n + 1 au point a. 
Alors pour tout x € I on a 


(x _ ati 
(n +1)! 


L'étude locale d’une fonction, consistant le plus souvent en un développement 
limité à un ordre intéressant de la fonction au voisinage d’un point, est l’une 
des deux applications principales de la formule de Taylor, l’autre étant le 
développement en série entière. 


FAR FD (a) + o (x — a+). 


1! 
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5.8.4 Fonction développable en série entière 


Le développement en série entière de fonctions est, comme nous l’avons sou- 
ligné, l’une des applications principales de la formules de Taylor. On écrit, 
quand le développement est possible, l'égalité d’une fonction et de la somme 
d’une série entière sur tout un intervalle. Le seul espoir d'obtenir pour une 
fonction f un développement en série entière sur un intervalle ouvert J, est 
que f soit indéfiniment dérivable sur J, et dans ce cas, le développement de f 
autour d’un point a de l'intervalle 7 sera donné par : 


(x — a)". (5.6) 


À partir de là, plusieurs cas sont possibles : 


(1) La série entière (5.6) à un rayon de convergence nul et donc f n’est pas 
développable en série entière au voisinage de a. 


Exemple 1 : La série de fonctions de terme général u,(x) = e "sin(n?x) 


converge sur R vers une fonction f indéfiniment dérivable. La série de Taylor 
au point 0 de cette fonction a un rayon de convergence nul. 


Exemple 2 : Le théorème de Borel affirme que si on se donne une série 
entière formelle, il existe une fonction f indéfiniment dérivable dont la série 
de Taylor en 0 soit la série entière fixée. À partir de là il est facile de montrer 
l'existence d’une fonction f dont la série de Taylor en 0 est 37% 4nlx”, qui 
est de rayon de convergence nul. 


(2) La série entière (5.6) a un rayon de convergence À > 0, mais quel que 
soit le voisinage V de a inclus dans le disque de convergence, f ne coïncide pas 
sur V avec la somme de la série entière. Dans ce cas, f n’est pas développable 
non plus au voisinage de a. 


Exemple : la fonction définie par : 


- ea si T'AÛ 
ro) = { 0 si æ—0 


est indéfiniment dérivable et toutes ses dérivées sont nulles en 0. La série de 
Taylor de f converge donc vers la fonction nulle sur tout intervalle, qui n’est 
en aucun cas f. 


(3) La série entière (5.6) a un rayon de convergence R > 0 et il existe un 
voisinage V de a inclus dans le disque de convergence où f est la somme de la 
série entière. Dans ce cas f est développable en série entière au voisinage de a. 
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L'étude passe par l’observation du reste dans la formule de Taylor : 


fee); ee" | ET y40) (a. 


n! F n! 


En effet, si sur un intervalle ]a — h, a + h[ on montre que le reste 


Rt)= | FE ;e40) (6) 


n! 


converge vers Ü, alors f est développable en série entière sur Ja — h, a + h|. 


5.8.5 Cas des dérivées positives 


Le résultat suivant est assez intéressant et mérite d’être signalé. 


Théorème 5.14 Si f est indéfiniment dérivable sur | — a, al et a toutes ses 
dérivées positives sur [0, a[, alors f est somme de sa série de Taylor sur [0, al. 


Preuve. Notons P, le polynôme de Taylor de f en 0 à l’ordre n, et R, le 


reste. 


avec 


Soit x € [0, a[. Fixons un d tel que x < d < a. On a : 


ce qui permet d'écrire l’encadrement grossier, compte tenu du fait que les 
dérivées sont > 0 : 
0 < Rn(d) < f(d). 


Par changement de variable u = dt/x, on obtient : 


pee (2) [EE pra a 


soit (puisque FT () < f(x) < FT (à) : 


0< Rat) < (5) RD (5) F@ 


Le terme de droite de cette double inégalité tend bien vers 0. sm 
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Ceci s'applique notamment à la fonction tan(x) dont on peut ainsi montrer 
simplement qu’elle est développable en série entière autour de 0, le rayon de 
convergence de cette série étant t/2. Bien entendu, ce dernier résultat a une 
explication plus profonde. Il faut pour cela se placer dans le plan complexe. 
Soit f une fonction analytique au voisinage d’un point 20. Le rayon de conver- 
gence de la série entière, développement de f au voisinage de z est la distance 
de z au plus proche point singulier (complexe) de f. En effet le cercle de 
convergence comporte toujours au moins un point singulier. Et il n’y à pas de 
point singulier à l’intérieur du disque de convergence. Si on veut appliquer ceci 
à la fonction tangente, on commence par montrer qu’elle est bien analytique 
tant que cos(z) ne s’annule pas, comme quotient de deux fonctions analytiques. 
Le point singulier le plus proche de 0 est le zéro de cos(z) le plus proche de 0 : 
c’est 7/2. 

Cette façon de voir permet de comprendre entre autres choses, pourquoi le 
développement de 1/(1+ x?) en 0 a pour rayon de convergence 1, alors même 
que sur R, la fonction f est définie partout. En fait le rayon de convergence 
est tributaire de ce qu'il se passe dans € et pas seulement dans R. 


5.8.6 Retour sur la méthode de Newton 


La formule de Taylor, permet de revenir sur la méthode de Newton exposée 
dans la section 5.4.3. En appliquant alors (pourvu que les hypothèses soient 
remplies) la formule de Taylor à l’ordre 2, on peut montrer que dans cette 
méthode l’approximation est quadratique, ce qu’on avait déjà constaté dans 
un certain nombre de cas particuliers. 


5.9 La formule d’Euler-Maclaurin 


5.9.1 Un exemple à la main 


> Présentation du problème 
Il s’agit d'étudier la convergence de la suite (5,),-, de terme général : 


Puis, ayant établi la convergence de cette suite vers une limite S, nous essaie- 
rons d'évaluer la rapidité de la convergence en évaluant S — 5. 

> Convergence de la suite 
La suite (S,),-, est croissante. En effet : 


1 


CAT Qu 


5.9. LA FORMULE D'EULER-MACLAURIN 195 


donc : 
Sn+1 > Sn. 
Considérons la courbe (C) d’équation : 
! 
V — 22 
La somme $, s’interprète comme la somme des aires des triangles hachurés 
sur la figure 5.5. En considérant par ailleurs l’aire sous la courbe, on en déduit 
que : 


En conséquence : 
1 
Sn <2——<2. 
n 


La suite (S,),,:, étant croissante et majorée converge. Elle converge vers un 
nombre $ < 2. On peut montrer que S = r?/6, ce que nous admettrons ici. 


FIG. 5.5 —- Majoration 


> Évaluation de S — DS 


Posons : 
S'— Sy = Ry. 
L’entier n étant fixé, pour tout entier m tel que m > n +1, posons : 
1 1 
Pau, Et ==, ji 
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qu’on peut encore écrire : 
Pr Sn = 0e 


L’entier n étant fixé, la suite (Ram), converge donc vers R, = S —S,. On 
obtient un encadrement de Ry,n par une majoration du style de celle suggérée 
par la figure 5.5 et par une minoration telle que celle suggérée par la figure 5.6. 


1/4 


n+l 


F1G. 5.6 —- Minoration 


TE dé 7 dx 
72 < Ram < 7.2? 
n+1i À n À 


c’est-à-dire que pour tout m > n : 


1 1 1 1 
COINS 
n+i m+l < Finm < n M 
et donc : , 
<R, < — 
RL R 
Cet encadrement nous permet d’obtenir l’encadrement suivant : 
1 1 1 1 
DÉS Rn > 


Ton n On+l nn 
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» Amélioration de l’évaluation de S — 5, 


On va évaluer plus finement la différence entre l’aire sous la courbe et l’aire 
des rectangles construits sur la figure 5.5. Pour cela notons : 


et : m q 
zx 
he | ë 
n,m . ] 
Alors : . 
Tum FT Ram — ÿ A, 
k=n+1 
et en passant à la limite sur m : 
mm 
un 
k=n+1 
Or : 
1 1 1 1 


k=1 & K KE(K-1l) 


ce qui nous permet de donner l’encadrement suivant : 


1 1 
— <A à 
ki F— (k-18 
En faisant cette fois-ci intervenir la courbe d’équation : 
1 
Y — 13° 


et en raisonnant sur des aires bien choisies comme dans le paragraphe précé- 
dent on obtient successivement : 


HÉba k1 y 
| Te AE | 73 
k T k-2 % 


LE) AS (-) 


et par sommation et simplification : 


mm) 24e) 


198 CHAPITRE 5. OUTILS ÉLÉMENTAIRES DE L’'ANALYSE 


On en conclut par passage à la limite sur m : 


1 1 1 R. < 1 1 
2(n+1ÿ nn 7 2(n—-1)? 
On peut alors écrire : 
1 1 R 1 1 : 1 
n 27? F2 \(n-1) (n+1)/° 
1 1 2 
n  2n? | (n—1)8 


On peut donc conclure que : 

n  2n? 
est une bonne approximation de À}. 
Si nous analysons ce que nous avons fait : 


(1) Nous avons comparé la série à une intégrale, c’est-à-dire que sur les 
intervalles [k, k + 1] nous avons d’une part l’intégrale : 


k+1 
Th = | J(t)dt, 


(avec ici f(x) = 1/x?) qui représente l’aire sous la courbe donnée par la fonc- 
tion f au dessus de [k,k + 1], d'autre part f(k) qui représente l’aire sous la 
marche d'escalier de hauteur f(k) au dessus de [k, k +1] (marche d’escalier au 
dessus de la courbe) ou encore éventuellement f(k + 1) qui représente Paire 
de la marche d’escalier au dessous de la courbe. 


(2) Nous avons cherché à évaluer la différence entre l’aire sous la courbe 
et l’aire sous une quelconque des deux marches (au dessus ou au dessous), 
c’est-à-dire : 


Ik,k+1 — f(k), ou si on veut f(k +1) — IKx71. 


Nous avons fait cette évaluation de manière un peu artisanale. Nous allons 
voir maintenant, comment ce même problème peut être attaqué de manière 
plus systématique par la formule d’Euler-Maclaurin que nous allons exposer, 
en reprenant l’évaluation de la différence entre ces deux aires (mais pour f 
quelconque, suffisamment régulière). 
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5.9.2 Un pas vers la formule d’Euler-Maclaurin 


Soit f une fonction de classe C* sur [0,1]. Cherchons à exprimer 


Î f(bdt. 


Pour cela on peut commencer par dire en remplaçant f par sa valeur en 0 
qu'une valeur approchée de l'intégrale est f(0). Etudions alors 


1 
W = | f(b)dt — f(0). 


On est donc dans un cas tout à fait similaire à celui traité à la main. on voit 
que 


1 
w= f G@-70)4 
0 
ce qui par intégration par partie (on dérive f(t) — f(0) et on intégre 1) donne 


1 
W = [A0 (f(#) — FOIE — 1h f'(6) PA (dt, 


où Pi(t) est une primitive de 1 (donc de la forme { — a) à bien choisir. 


1 
W = (1- a) (f(1) — f(0)) - jl f'(E)Pi(t)dt. 


L'intégrale qui reste dans le second membre peut à son tour être intégrée par 
partie en dérivant f’ et en intégrant P. Soit P2(t) une primitive de Pi(t). 
Choisissons P.(t) tel que P2(1) — P2(0) ou encore 


. Pi(#)dt = 0. 
0 


Ceci impose de prendre a = 1/2 (Pi(t) = t — 1/2). On a alors 


1 
W =1/2(f(1) — f(0)) — P2(0) (f'(1) — f'(0)) + | Pit) FO (b)dt. 


Intégrons de nouveau par partie l’intégrale qui subsiste au second membre. 
Notons P;(t) une primitive de P:(t) et choisissons P2(t) de telle sorte que 
P3(1) — P3(0). Comme Pi(t) = {— 1/2 on à Pa(t) — 2/2 = t/2 + C'et la 
condition imposée 


['awa 6 
0 
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donne C = 1/12. Alors P;(t) = t/6 — t?/4+1t/12 + C, et si on impose aussi 
la condition 


['awa = 
0 


alors P3(t) = t/6—t?/4+1t/12. On obtient après une nouvelle intégration par 
partie : 


1 
W =1/2(f(1) — f(0)) —1/12 (F1) — f'(0)) Ps(t)f (bat. 


Arrêtons là le développement et écrivons en conclusion 


1 1 
| f(é)dt = 1/2(F(0) + f(1)) — 1/12 (FD) — F0) - [ Pa(t)f 9) (dt. 


0 
5.9.3 Polynômes de Bernoulli 
Les calculs précédents mettent en évidence la suite des polynômes de Bernoulli. 


Théorème 5.15 1! existe une suite (Qu}n>o et une seule de polynômes telle 
que 


(1) Qo=l, 
(2) Qu =Qn1, pourn > 1, 
(3) [ent = 0, pour n > T. 
Ces nn sont appelés polynômes de Bernoulli. 
Preuve. Par récurrence sur n. Le polynôme Q5 est bien défini et, Qh_1 étant 


construit, la condition (2) fixe Q» à une constante près. La condition (3) fixe 
cette constante. = 


Compte tenu du mode de construction de ces polynômes, il est facile de voir 
que leurs coefficients sont rationnels. 


Voici les premiers polynômes de Bernoulli : 


Proposition 5.1 Pour n > 2, Qu(1) = Qn(0). 
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Preuve. En effet on doit avoir fe Qn-itu)du = 0. Mais comme Q, est une 
primitive de Qh-1 on à fe Qn-1(u)du = Qn(1) — Qn(0), d’où le résultat. 


PL 


Proposition 5.2 Sin > 1, Qu(x +1) — Q\(x) = he Dé 
n— 1)! 


Preuve. On constate que l'égalité est vraie pour n = 1. Supposons la vraie 
pour n, par primitivation on obtient alors l’égalité à l’ordre n + 1 à une 
constante près. Mais la proposition précédente permet de conclure à la nullité 
de cette constante d’intégration. m 


Cette égalité permet de calculer des sommes du type ie k”. Par exemple 
sin — 2 on obtient 
Q(p+1)-Q1)=5 DE, 
k=1 
ce qui donne 
D __pp+ DEP + 1) 


ES 
Il 
un 


Proposition 5.3 Pour tout n > 0, Q,(1— x) = (—-1)"Q,(x). 


Preuve. Le résultat est vrai pour n = 0 et n = 1. Supposons le résultat vrai 
pour n > 2. Alors par primitivation on obtient au rang n +1 la formule voulue 
à une constante d'intégration près 


Qu — 2) = (1) Quu(æ) + C. 


Si n + 1 est pair en donnant à x la valeur 0 on calcule C = 0. 
Si n + 1 est impair alors par primitivation 


QC = ä) — Qn+2(x) ROBE D, 


en prenant x = 0 on obtient d’abord D = 0, puis en prenant x — 1 on obtient 
C=0. = 


Proposition 5.4 Pour n > 1, 
Qon+1(0) = Q2n+1(1/2) = Qon41(1) = 0. 


Preuve. Il suffit d'appliquer la proposition précédente avec x = 0, ce qui donne 
Qon+1(0) = Qon+1(1) = 0, puis avec x — 1/2, ce qui donne Q2:+1(1/2) = 0. 


En étudiant par récurrence les variations des fonctions Q,, on pourra montrer 
que : 
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Proposition 5.5 Pour n > 1, Q2»(0) Z 0 et Signe(Q2,(0)) = (—-1)"*1. 


On notera 

By = (—1)* "1 (2k)! Qox (0). 
Ainsi les B, (nombres de Bernoulli) sont des rationnels positifs. Les pre- 
miers nombres de Bernoulli sont 


B1=1/6, B2=1/30, B3=1/42, Bi1=1/30. 


5.9.4 Formule d’Euler-Maclaurin 


Soit f une fonction réelle de classe C® sur [0, 1]. 


fQ) — f(0) =1/2(/(0) + F0) — | QD (Da, 
et par récurrence on montre que : 


Théorème 5.16 Soit f une fonction réelle de classe C® sur [0,1]. Alors pour 
tout n > 1: 


(P'(2) + F'(0) D 2 (F9 (1 - 29 (0) 


e À Qon+1(x)f 29 (x)dx. 
0 


En particulier si on applique ce résultat à une primitive de f on obtient 


['roœ- ue Ds M(FPA-0 (1) — F 8-0 (0) 


0 


On peut appliquer le théorème 5.16 sur un intervalle {a, b] au lieu de [0,1]. Il 
suffit comme toujours de faire le changement de variable affine qui envoie a 
sur 0 et b sur 1: t = a +u(b — a). On obtient alors : 
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Théorème 5.17 Soit f une fonction réelle de classe C® sur [a, b]. Alors pour 
tout n > 1: 


b—a 


nf _4\k 7. 
140) = + FO) + (00 — 189 (a) 
k=1 


b 
= | Qut(y — —)(b — a)27-1 f@r +2) (u)qu. 


Découpons maintenant l'intervalle [a, b] en q morceaux de même longueur 
h = (b — a)/q sous la forme : 


a = Gÿ < A < 2 < °°° < Gg_1 < Ag — D, 


appliquons le théorème 5.17 sur chaque morceau et sommons les résultats. 
Nous obtenons : 


Théorème 5.18 Soit f une fonction réelle de classe C® sur [a,b]. Soit 
a = ag < & <:°: < ag < ag = bd le partage de [a,b] en q intervalles de même 
longueur h = (b — a)/q. Alors pour tout n > 1 : 


qg—1 
(0) — {a) = S{aa) — S{ao) = 20) + F'(a)) + RD P'(as) 
s=1 


n 
72 
k=1 


h q— 1 
À Qon+1 (>) D FRA. + ) dv. 
s=0 


Cette dernière formule est appelée la formule sommatoire d’'Euler-Maclaurin 
car elle permet de calculer la somme : 


(CEDPBEREE 


Gr 406) - 100) 


5.9.5 Application à l’évaluation de restes de séries 


Considérons la série de terme général 1/n?. On sait que cette série converge 


et que : 
S=> > 
k=1 


QE 


me 
= 
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Ecrivons la somme $ sous la forme : 


Où : 
di SE 
H=) 7 À Re) 
k=1 k=p+1 
Nous cherchons à évaluer R,. Pour cela introduisons la fonction f(x) = —1/x 


dont la dérivée est f’?. Appliquons le théorème 5.18 à la fonction f sur l’inter- 
valle [p,r + 1] (où p et r sont des entiers) avec h = 1 et n = 1. Nous obtenons 
successivement : 


1 1 1/1 1 1/1 1 
Ry — Rr = T, 
7 Op r+l uen =x)+ At 


et en faisant tendre r vers +0 : 


_p 2p 
où 7, se calcule facilement en utilisant le théorème 5.18. Un calcul simple 
(comparaison d’une somme de série avec une intégrale) permet de voir que : 


1 
m=0(%). 


ce qui donne pour R, le développement asymptotique : 


1 1 1 f 
Re = Of 
SD 2 Ep (+) 


5.9.6 Remarque 


Dans l’étude précédente, nous avons appliqué plusieurs méthodes conjointes : 


1. tout d’abord nous sommes passé du discret au continu en comparant une 
série avec une intégrale ; 

2. ensuite, nous avons appliqué une méthode d’intégration par partie ou 
plutôt une de ses conséquences évoluées : la formule d’Euler-Maclaurin. 


Si nous étions resté dans le cadre strict des séries, nous aurions pu arriver 
(mais c’est assez pénible) à un développement asymptotique du reste de la 
série de terme général 1/n? en utilisant la version discrète de l’intégration par 
partie, c’est-à-dire la transformation d’Abel. 
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5.10 Le théorème de Weierstrass 


5.10.1 Présentation du problème 


Nous montrons essentiellement les deux versions suivantes du théorème de 
Weierstrass. 


Théorème 5.19 Soit f une fonction continue sur un intervalle fermé borné 
[a,b] à valeurs complexes. Il existe une suite de polynômes qui converge uni- 
formément vers f. 


Théorème 5.20 Soit f une fonction continue sur R, 27-périodique, à valeurs 
complexes. Il existe une suite de polynômes trigonométriques qui converge uni- 
formément vers f. 


Nous donnons sous forme d’exercices diverses démonstrations de ces résultats. 
En particulier nous insistons sur l'importance de la notion de noyau positif. 
Nous terminons en donnant une version améliorée de ces résultats, exprimée 
en terme d'opérateurs positifs (Théorème de Popoviciu, Bohman et Korovkin). 


5.10.2 La démonstration élémentaire d’Henri Lebesgue 


> Approximation de |x| 


Exercice 1 (Méthode 1) Soit x un élément du segment [1,1]. Posons 
u=1-—x?, donc |x| = V1 —u. En conclure que la fonction f(x) = |x| est sur 
[-1,1] limite uniforme d’une suite de fonctions polynomiales. 


Exercice 2 (Méthode 2) Définissons une suite de fonctions polyno- 
miales à coefficients réels par 


Po(x) = 0 
1 
Pt) = Pr) € 5 (c—P,/,(x)) pourn>1 
Montrer que la suite P, converge uniformément sur [0,1] vers /x. 
En conclure que |x| est sur [1,1] limite uniforme d’une suite de fonctions 
polynomiales. 


» La méthode de Lebesgue 


Exercice 3 Soit C[0, 1] l’espace des fonctions continues sur [0, 1] à valeurs 
dans R, muni de la norme uniforme. Soit A le sous espace de C[0, 1] constitué 
des fonctions continues affines par morceaux. 

a) Montrer que À = C{0, 1]. 
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b) Montrer que les fonctions constantes et les fonctions du type (x — a + 
Ix — al) forment un système générateur pour A. 

c) Soit P le sous espace des fonctions polynomiales de [0, 1] dans R. Montrer 
que P = C{0, 1] 

d) Soit [a,b] un intervalle fermé borné de R, montrer que tout élément de 
Cla,b] (espace des fonctions continues de [a,b] dans R) est limite uniforme 
d’une suite de fonctions polynomiales. 

e) Démontrer un résultat analogue pour Ccla, b], espace des fonctions conti- 
nues de [a, b] dans €. 


5.10.3 Les noyaux positifs 


Exercice 4 Soit I5(x) = {y | 0 <y<let x —y| > 6}. Soit (Kan une 
suîte de fonctions de deux variables réelles à valeurs réelles telles que 


a) Pour toutx ER on a 


1 
1 Ka(x,y)dy =1 n—1,2,... 
0 
b) Pour tout x ER on a 


lim Kauido=0) 0 0 


n— OO I5(x) 
c) Les K, sont positifs, 
K,(x,y) > 0 n—1,2,.:. 


Soit f une fonction continue à valeurs complexes sur [0,1]. Définissons 


1 
AD = [EG 0 dr 
Montrer que pour tout x € [0,1], 


lim 4,(f)(x) = f(x) 


n— 00 


et que si dans l'hypothèse b) la convergence est uniforme par rapport à x alors 
Ahn(f) converge uniformément vers f. 


Exercice 5 Soit [a,b] un segment tel que a < 0 < b. On considère une 
suite (Dn)n de fonctions réelles intégrables sur [a, b] satisfaisant à 
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a) Pour tout entier n > 0 on a 
b 
| b, (dt = 1. 
b) Pour tout n > 0 tel que [—-n,n] © [a, b] 


Jim ( L (bat + | | 2100) 2f; 


c) Pour tout entier n > 0 on a ®, > 0. 


Etant donnée une fonction f continue sur R on pose 


b 
du +f(e)= [| f-06(bdt 
a 
Montrer que la suite (d, x f)}n converge uniformément vers f sur tout compact. 


Exercice 6 Soit f une fonction continue périodique de période 27. On 


pose 

à = : Ft de 

LV ; 

br = L f(é)sin(kt)dt, 

puis 
S,(f)(æ) = + D(ax cos(kz) + besin(kx)), 
k=1 

et 


n—1 
on) = + D Sk(F)(r). 
k=0 


Montrer que 


7 in ((n + À 
(Na) == | 1@+ pe 20 ” 
et que | | | 
ae = pe [ire +20 (0) a 


Montrer que on(f)(x) converge uniformément vers f(x) (théorème de Fejér). 
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Exercice 7 Posons (noyau de Landau) 


_ fol)" si -1<x<1 
Qn(n = À si æ > l ou & < —1. 


où Cn est choisi de telle sorte que 


1 
j Q(É)dé = 1, 
À 
Montrer que si x € [0,1] alors 
(1— x} > 1- nx°, 


puis QUE En < VN. 
Soit f une fonction continue sur [0,1] telle que f(0) = f(1) = 0. Étudier 


1 
Qn* (= | FHQu(x - D 
où x € [0,1]. En conclure le théorème de Weierstrass. 


Exercice 8 Soit f une fonction continue sur [0,1]. Posons (polynômes 


de Bernstein) 
nm 


BA (Po) = D CRF (À) GA 2) rar. 


p=0 


On se propose de montrer que la suite (BA(f)),>1 converge uniformément 
vers f. 


a) Posons r}(x) = Ch(1 — x)" Px?, montrer que 


(On pourra utiliser le développement de (x + y)”. 
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b) Calculer 


n 


DE nx)r(x). 


p=0 
c) On sait que Ve > 0,26 > 0 t.q. [x — x’| < Ô implique | f(x) — f(x)| < €. 
On étudiera alors la somme 


5 (4) # (2) rota) 
p=0 


en la décomposant en deux suivant que |p — nx| < ôn ou que |p — nx| > ôn et 
on conclura. 


5.10.4 Les opérateurs positifs 


Exercice 9 Soit K un espace topologique compact et C(K) l’espace des 
fonctions continues sur K° à valeurs réelles normé par 


If = sup |f(æ)|: 
x€eK 
Soit T un opérateur linéaire de C(K) dans lui même tel que 
Vfe C(K), f>0— T(f) > 0. 


On dit alors que T est un opérateur positif. 
Montrer que T est un opérateur continu et que 


IT = lil, 
où 1x est la fonction constante valant 1 sur K. 


Exercice 10 Soit B, l'opérateur de C0, 1] dans lui même défini par 


B (Pa) = Ÿ ( à ) (1 = hf (2) | 
Calculer | Bal. 


Exercice 11 Soit f une fonction continue périodique de période 27. On 
reprend les notations de l’exercice 6. La fonction f peut être considérée comme 
élément de C* = C(T) où T est le tore R/(27Z). On définit donc sur C* 
l’opérateur S, par 
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D, (#) = sin ((2n + 1)5) 


(noyau de Dirichlet) et l’opérateur o, par 


1 T 
On(f)(x) == | f()Kn( — x)dt 
T TT 
avec ; 
1 fsin(# 
mn sin (4) 
a) Montrer que o, est un opérateur positif et que [lon] = 1. 


b) Montrer que pour tout n, S, n’est pas un opérateur positif. Montrer que 
1 PT 4 
Sn = =  Da(t)idt = = log(n) + O(1). 
T Jr T 


Un nombre x étant fité, calculer la norme de la forme linéaire S% sur C* 


définie par Sy(F) = Sn(f)(x). 


Exercice 12 {Théorème de Popoviciu, Bohman et Korowkin) 
Soit K un espace topologique compact possédant au moins deux points et C(K) 
l’espace des fonctions continues sur K° à valeurs réelles normé par 


If = sup | f(x)|: 
xEeK 


Soient f1,f2,---, fm des éléments de C(K) vérifiant la propriété : 


Il existe m fonctions continues réelles 


@1, 42, °*" , Am définies sur K, telles que la fonction 
(1) Q(x, y) = D 1 œiy)fi(x) satisfasse à 
a) Q(x,y) > 0 


b) Q(x,y)=0 > zx =y. 


Soit L, une suite d'opérateurs positifs de C(K) dans lui-même vérifiant : 

pour tout i(i= 1, ,n) la suite (L,(fi)), 
Le but du problème est de démontrer que dans ces conditions pour toute fonc- 
tion f € C(K) la suite (L,(f)), converge vers f. 


converge vers f; dans C(K). 


n 


Partie I. Soit E le sous-espace vectoriel de C(K) engendré par f1, fa, --:, 
Îm. 
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a) Montrer que si f € E la suite (L,(f)) 
b) Montrer qu'il existe g € E tel que pour tout x € K on ait g(x) > 0. 


Soit y fixé dans K. On note Q, la fonction définie par Qy(x) = Q(x, y). On 
note ®, la fonction définie par @,(y) = Ln(Qy)(y). 


c) Montrer que la suite (@,),, converge uniformément vers 0. 


n converge vers f. 


d) Montrer qu'il existe Mo > 0 tel que pour tout n on ait || L,(1K)|| < Mo 
où 1x est la fonction constante valant 1. 


Partie II. Soit F un élément de C(K x K). Si y € K notons F,, la fonction 
définie par F,(x) = F(x,y). Supposons en outre que F(x,x) = 0 pour tout 
ze K. 


a) Soit € > 0 montrer qu'il existe un compact À C K x K tel que 
(x,y) É A |F(x,y)l <e, 
= inf ,y) > 0. 
m no y) 
Notons alors M = sup(z ea Ft, y)|. 


b) Montrer que pour tout couple (x, y) € K x K on a 


M 
c) En conclure qu'il existe un entier N tel que Vn > N,Vy € K on ait 
[Ln(Fy)(y)l < (Mo + 1)e. 


Partie III. Soit f un élément de C(k). On pose 


Fay) = f(x) - (x). 


En utilisant les résultats précédents, montrer que la suite (L;(f)) 
vers f. 


n CONVETIYE 


Applications. 
a) On prend K = [0,1], m = 3, f1 = 1x, f2 = x, f3 = 2°. on vérifiera avec 


Q(x, y) = (y — x)? que ce système satisfait bien à la condition (1). On prend 
Ln = Bn (opérateur de Bernstein). Retrouver ainsi les résultats de l’exercice 8. 


b) On prend K =T = R/(27Z), m = 3, f1 = 1r, f2 = cos(x), fs = sin(x). 
On vérifiera avec Q{x,y) = 1 — cos(x — y) que ce système satisfait bien à la 
condition (1). On prend Ly = on (opérateur de Fejér). Retrouver ainsi les 
résultats de l’exercice 6. 
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5.11 Interpolation de Lagrange 


5.11.1 Introduction au problème 


L’interpolation est un sujet très vaste lié aux questions d’approximation 
des fonctions. Très grossièrement il s’agit de trouver dans une classe fixée de 
fonctions (par exemple les fonctions polynomiales) un élément réalisant un 
certain nombre de contraintes. Souvent ces contraintes sont liées à la donnée 
d’une fonction f qu’on cherche à approcher par un procédé d’interpolation 
(par exemple la fonction cherchée doit prendre la même valeur que f en des 
points donnés). On se trouve alors confronté à plusieurs problèmes de natures 
différentes. Tout d’abord un problème algébrique, celui de trouver le ou les 
éléments de la classe choisie qui réalise les contraintes. Ensuite un problème 
d’approximation qui consiste lorsqu'on est parti d’une fonction f à mesurer 
la qualité de l’approximation théorique obtenue. Enfin un problème algorith- 
mique, celui de déterminer un algorithme performant qui permette de calculer 
facilement et de manière aussi exacte que possible la ou les solutions. 

Soient Zo, T1, .…, Zn des nombres complexes distincts et Yo, y1, .…, Yn des 
nombres complexes. Il s’agit de trouver un polynôme P(X) vérifiant P(xx) = 
yL pour toutes les valeurs de 4 comprises entre 0 et n. 


5.11.2 L'aspect algébrique 


> Existence de solutions Notons C[X] l’espace des polynômes à 
coefficients complexes et C,[X] le sous espace des polynômes à coefficients 
complexes de degré inférieur ou égal à n. Considérons alors l’application li- 
néaire T de C[X] dans C"*! qui à un polynôme P(X) fait correspondre 
(Pro PPT 
On voit que le noyau Ker(T) de l'application T est l’espace constitué des 
multiples du polynôme N(X) = (X — x0)(X — x1)...(X — x») et qu’on peut 
écrire 

CIX] = Ca[X] & Ker(T). 
Ceci nous montre que la restriction de T à C;[X] est une bijection de C;[X] 
su CFE 


Le résultat obtenu est donc le suivant : 
Théorème 5.21 Pour tout élément (yo, y1, …, Yn) de C"*1 il existe un poly- 
nôme P(X) de degré < n et un seul (polynôme d'interpolation de Lagrange) 


tel que P(xx) = yr (0 <k Ln). Tout polynôme Q(X) (de degré quelconque) 
vérifiant aussi Q(xx) = yx (0 < k Ln) s'écrit sous la forme 


Q(X) = P(X) + K(XIN(X). 
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»> Ecriture sous la forme naturelle (base des monômes) Si on 
cherche à trouver explicitement le polynôme de Lagrange écrit sous la forme 
habituelle P(X) = ao + a1X +... + an X” on est amené à résoudre le système 
de n + 1 équations en les n + 1 inconnues &o,.…, @n : 


Q0 + 41T0 + .… + Antp — Yo 
Go + QG1T1 +. + GnTT = Yi 
Q0 + GiTn +... + AnTn = Yn- 


Ce système est un système de Vandermonde dont on sait bien sûr qu’il 
admet une solution unique. Nous fournirons ultérieurement un algorithme pour 
résoudre ce système plus rapidement que ne le ferait une méthode classique 
comme la méthode du pivot par exemple. 


» Ecriture sous forme de Lagrange  Aïnsi le calcul des coefficients a; 
du polynôme cherché se ramène à la résolution d’un système de Vandermonde. 
Sans être très compliqué ceci n’est cependant pas immédiat. Or il peut se 
faire qu’on n’ait pas absolument besoin des coefficients a; et qu’on puisse se 
satisfaire d'exprimer le polynôme d’interpolation dans une base mieux adaptée 
que la classique base des monômes. Dans cet ordre d’idée, introduisons les n+1 
polynômes Ly(X) (où 0 < k < n) qui vérifient 


ee 1 
Lifas) = 0 sij£k. 


D’après l’étude qui précède le polynôme L£(X) existe et est unique. On vérifie 


aisément que L&;(X) s'écrit explicitement sous la forme 
ro (X — xo)...(X — zx_1)(X — zx+1)...(X — ïn) 
(tr — to)... (tx — Tk-1)(Tx — Tk+1).….(tx — Tn) 


Ces polynômes forment une base de C;[X] et le polynôme d’interpolation 
s'exprime dans cette base 


P(X) = Su Lr(X). 
k=0 


Il est intéressant de remarquer que le polynôme L}(X) s'écrit aussi 
N(X) 

(X — ze) N'(xx) 

où NX) = (X — xo)(X — z1)...(X — zh). 


Le(X) = 
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» Ecriture sous la forme de Newton L’inconvénient des polynômes 

Le(X) est que chacun d’eux fait intervenir tous les points d’interpolation et 
donc si on rajoute un nouveau point tout calcul fait à partir des polynômes 
Ly(X) doit être entièrement refait. 
Prenons alors les polynômes N£(X) = (X — x%0)(X — x1)...(X — xg_1) où 
O0 <k<n (avec No = 1). Ces polynômes forment aussi une base de C,[X] 
et le polynôme d’interpolation se décompose sur cette base sous la forme de 
Newton 


P(X) = D NE(X). 
k=0 


Le problème est alors de calculer les coefficients b4. Pour ce faire définissons 
les différences divisées successives des valeurs y; par rapport aux points x; : 


[vo] = Yo 


[u1, 529 rh] _ [yo ..…. Yk-1] 


[Vo, V1, .…, Yx] = ; 
Th — TO 


Théorème 5.22 Les coefficients de la décomposition du polynôme d’interpo- 
lation de Lagrange de degré n dans la base de Newton sont donnés par 


bg Du [vo, V1, yr] 
où0O<Kk<n. 
Preuve. La formule à démontrer est clairement vraie si on a n = 0. Supposons 
la formule vraie pour les polynômes de degré n — 1 interpolant en n points. 
Soit alors P;_1(X) le polynôme d’interpolation de Lagrange associé aux points 
To, T1, + Tn_1 et aux valeurs Yo, Y1, ..…, YUn_1 Qn_1(X) le polynôme d’interpo- 


lation de Lagrange associé aux points z1,%2,...,2, et aux valeurs y1,Y2,…., Un 
et 


P(X) = Ye N(X) 
k=0 


le polynôme d’interpolation de Lagrange associé aux points æ%0,%1,..,%n et 
aux valeurs Yo, y1,-, Yn. Il est facile de voir que 


n—1l 
Pa-1(X) = SC bNE(X) 
k=0 


si bien qu’il reste simplement en vertu de l’hypothèse de récurrence à établir 
la formule pour le coefficient b,. 
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Pour cela définissons 


On vérifie que 
pour 0 << n. Donc 


En égalant les coefficients du terme de degré n dans l'expression des poly- 
nômes P, et P, on obtient la relation cherchée. m 


En comparant l’expression de Newton du polynôme P, d’interpolation en k+1 
points avec celle de Lagrange on trouve en regardant les coefficients des termes 
de degré k 

k 


V5 
V0; V1, -.., VE] — AT Li 
| 2 Ni G) 


Il est clair dans cette représentation que le rajout d’un nouveau point ne 
fait que rajouter un nouveau terme au polynôme, les autres termes restant 
identiques. 


» Interpolation de Lagrange-Sylvester L’interpolation de Lagrange 
se généralise à l’interpolation de Lagrange Sylvester, où on impose comme 
condition au polynôme d’interpolation non seulement des valeurs en des points 
donnés, mais aussi les valeurs en ces mêmes points de ses quelques premières 
dérivées (le nombre de dérivées à valeurs imposées dépendant du point consi- 
déré). 

Plus précisément : Soit s un entier et, pour tout entier à tel que 0 <i <s,un 
entier d; > 1. On pose 


O<i<s 
Fixons %0,%1,°-: ,x%, des nombres complexes distincts et pour tout 0 <i<s 
des nombres complexes Y:,0,::: ,Yi.a,-1. Alors il existe un polynôme P(X) de 


degré n — 1 et un seul tel que pour tout 0 < à < s et tout 0 < j < dj —- 1 on 
ait : 
Ph) 


Remarquons que si tous les d; valent 1 on retrouve l’interpolation de Lagrange. 
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5.11.3 L’aspect algorithmique 


> Le calcul des différences divisées L’algorithme des différences 
divisées est très simple. Il utilise l'écriture du polynôme d’interpolation sous 
la forme de Newton. Les coefficients sont alors calculés par la formule de 
récurrence établie précédemment 


[vo] = Yo 


_ (gr, …, Ye] = [Yo: …, V1] 
[yo, y1, …, ur] — . 
Tk — T0 


si bien que le calcul se fait conformément à la figure 5.7. Le nombre d’opéra- 
tions à effectuer est en O(n?). 


[vol] 


[vo: U1;, V2 


| 

LL 
[Vo, ÿ1, Va, ya] 
| di 
y1, Ya, Y3] 


F1G. 5.7 — Le calcul des différences divisées 


»> Résolution d’un système de Vandermonde Nous avons vu que le 
calcul effectif des coefficients du polynôme d’interpolation de Lagrange dans 
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la base naturelle des monômes passe par la résolution d’un système de Van- 
dermonde. Voici un algorithme qui permet de résoudre un tel système. Cet 
algorithme est basé en fait sur l’algorithme de Hôrner pour l'évaluation de 
polynômes. Il est plus rapide que les algorithmes directs de résolution des sys- 
tèmes linéaires généraux comme la méthode du pivot de Gauss ou la méthode 
de Householder qui sont en O(n*) alors que nous obtenons ici un algorithme 
en O(n?). 

Soit N un entier > 2. Etant donné x = (x1,x%2,...,xn) un N-uplet de réels 
deux à deux distincts on note B la matrice 


1 1 1 

T1 T2 TN 

2 2 2 

B = T1 To TN 
N-1 ,N-1 N-1 


On cherche à résoudre le système 


BW = Q 
où Q est la matrice colonne constituée des seconds membres qg1,q2,---,qnN du 
système et où W est la matrice colonne constituée des inconnues w1,w2,--- ,WnN 


du système. 
Pour tout entier j vérifiant 1 < j < N on pose 


T — Tn 
ce Tj — Ln 


n#i 


P; est donc un polynôme en x de degré N — 1 qui peut s’écrire 


N 
Ft ÿ PONT in 
k=1 


En effectuant le produit de la matrice À = (A;x);x par la matrice B on 
constate que 
AB = (P;(xx));k 


ce qui prouve que À est l’inverse de B. On peut alors écrire que W = AQ. On 
obtient ainsi les formules | 
Wj — d À;,kk- 
k=1 
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Nous allons dans la suite mettre en place une méthode de résolution qui calcule 
les coefficients des polynômes P;, donc qui calcule l’inverse de la matrice B. 
Pour calculer les coefficients de P; on sera amené à calculer les coefficients de 


et aussi le dénominateur intervenant dans la formule qui définit P;, c’est-à-dire 
le nombre N;(x;). 


Posons P(x) = (x — x1)(x — x2)...(x — x). P(x) est donc un polynôme de 
degré N qui s'écrit sous la forme : 


P(r)= a onaN ka. LE 6 dr 


Montrons tout d’abord comment si on connaît les coefficients c; on peut cal- 
culer les coefficients du polynôme 


Pour cela posons 
Nix) = bnaN 1 +... + box + bi. 


On vérifie immédiatement sur l’expression de N;(x) que le coefficient du terme 
de plus haut degré est 1. En remarquant que P(x) = N;(x)(x — x;) on établit 
la formule 

bp_1 = Cp + z;jbk. 


Si bien que 
bn = 1 
bp = Cg + xd. 


Connaissant les coefficients de N; il est alors facile de calculer le dénominateur 
N;(x;) intervenant dans la définition de P,. 
En effet posons ty = bn = 1 et définissons pour tout 4 < N 


Lei = Zjtr + bp-1. 


On constate alors que t1 = N;(x;), le calcul proposé pour N;(x;) n'étant rien 
d’autre que l’algorithme de Horner. 


Il reste maintenant à calculer les coefficients c; de P. 
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Pour tout entier k vérifiant 1 < k < N on définit 
Qr(x) = (x — x1)(x — z2)...(x — xx) 
et on écrit Q4 sous la forme 
Qn(e) = 2 Hopper hop set 24... + aa. 


Il est facile de voir sur l’expression de Q1(x) = x — x1 que @11 = —x1. 
De la formule Q;(x) = Qx_1(x)(x — xx) découlent pour k = 2,3,...,N les 
formules 


Ak,k = Ak-1,k-1 — Tk 
Qk,j = Ak-1,j-1 — TkOk-1,; J = k—1,..,2 
ce qui achève l’algorithme. 


On peut voir que le nombre d'opérations à faire dans cet algorithme est en 
O(N?), la partie la plus coûteuse étant le calcul des coefficients cy. 


5.11.4 Partie approximation 
> Un exemple 


On considère la fonction f définie sur l'intervalle [0, 6] par l’équation : 


y = f(x) =6 (an(E 2) Fa 1). (5.7) 


Remarque 5.1 Cette fonction peut représenter l'élévation du niveau de la 
mer pour une marée en fonction du temps. La variable x est alors l’heure 
marée (1/6 du temps de passage de la basse mer à la haute mer) tandis que y 
représente le nombre de 1/12° (1/12 de la différence de niveau exprimé en 
mètre entre la haute mer et la basse mer). Nous allons chercher un polynôme 
qui approche cette fonction sinus sur cet intervalle. Le point d’inflexion nous 
donne à penser qu'il faut tenter une cubique pour être « dans la forme ». 


Nous allons donc chercher le polynôme d’interpolation P de degré < 3 tel 
que : 


+ P(0) = f(0) =0 ; 
e P(3) = f(3) —<6; 

e P(6) = f(6) — 12; 
e P'(0) = f'(0) = 0. 
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Les conditions P(0) = 0 et P/(0) = 0 imposent que : P(x) = x?(ax + b). Les 
deux autres conditions donnent respectivement 9a + 3b = 2 et 18a + 3b = 1, 


d’où : 
a = —1/9 
=: 
Le polynôme cherché est donc : P(x) = —£x* + x?. Nous avons représenté le 


graphe de P sur la figure 5.8. 


» Qualité des approximations 


Afin d'évaluer la précision de l’approximation P(x) de la fonction f(x), nous 
allons majorer la quantité 


sup |f(x) — P(x)|, 
x€[0,6] 


c’est-à-dire la norme uniforme ||f — P|l sur l'intervalle [0, 6]. 


> Un outil fondamental : le théorème de division des fonctions 
différentiables 


Théorème 5.23 Soit f une fonction réelle définie sur R de classe CPF!, où p 
est un entier naturel. On suppose que f s’annule en un point a de R. Alors il 
existe une unique fonction continue g(x) telle que : 


f(x) = (x — a)g(x). 


Cette fonction g est de classe CP et pour tout 0 < q < p : 


(9) (x)| < sup |f(+0 (|. 5.8 
|g AÉS a) (&)) (5.8) 


Preuve. La fonction g est nécessairement définie par : 


JG) , 
g(x)= 4 x—-a (5.9) 


On constate en distinguant le cas où x = a de celui où x £ a que : 


1 
g(x) — | f'(a+ (x — a)u)du. 
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Axe des Y gradué en 1/12 de marnage 
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Axe des X gradué en heure marée 


F1G. 5.8 — Approximation cubique 


Sous cette dernière forme, d’après le théorème de dérivation sous le signe 
intégrale, on voit que la fonction x + g(x) est de classe C? et que pour tout 
0<qg<p, 


1 
g) (x) = | us FH) (a + (x — a)u)du, 
0 


ce qui nous donne la formule (5.8). m 


»> Majoration de l’erreur dans une interpolation 


Soit f une fonction de classe C"+1, P le polynôme d’interpolation de Lagrange 
qui prend les mêmes valeurs que f aux points x%o,x1,...,% et Î un intervalle 
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Axe des YŸ gradué en 1/12 de marnage 


12 


Axe des X gradué en heure marée 


F1G. 5.9 — Comparaison entre le sinus et la cubique 


compact contenant æ, To, T1, .…., Tn. 
Appliquons alors le théorème 5.23 à f(x) — P(x). On obtient 


avec 


f(æ) — P(x) = (x — 0)go(x) 


98" (æ)| < sup|f Cr+1) (4) 


n+1; 


(ne pas oublier que PC) (x) = 0), puis 


go(x) = (x — x1)g1(x) 


6 


5.11. INTERPOLATION DE LAGRANGE 223 


avec 1 
198 0 (æ)| < = sup|gL” (6), 
N ter 


et ainsi de suite. Si bien que : 
1 


[f(x) — P(x)| < CE 


(x — %o)(x — x)... (x — tn)] Ju LÉO AE0) 


Remarque 5.2 Cette démonstration permet d'établir de la même façon une 
majoration dans le cas d’une interpolation de Lagrange-Sylvester. 


» Les majorations 


Si on ne regarde pas de plus près, on pourrait croire que nous avons fait 
une interpolation de Lagrange-Sylvester par un polynôme de degré 3 sous les 
conditions d’interpolation : 


P(0)=f(0) P(3)=7f(3) P(6)= (6) P'(0) = f(0). 


Mais en fait on constate qu'avec ce même polynôme de degré 3 on a aussi 
P'(6) = f'(6). Donc on a effectué en fait une interpolation de degré 4, dont 
le coefficient du terme de plus haut degré est nul. On peut donc appliquer la 
majoration (5.10) et la remarque 5.2 à cet ordre et on obtient : 


LAC) — PE) < See — 3) — 692] sup | OO 
‘ te[0,6] 


Ceci nous donne : 


La) — PGI < D x 6 x (7) le — 8)(x — 6) 


La) PEN < 2 * 6% aa (e — 3)(x — 6)2 


Pour étudier la borne supérieure de la fonction |x?(x — 3)(x — 6)?| qui est 
symétrique par rapport à æ = 3, il suffit de chercher son maximum sur [0,3]. 
Sur cet intervalle cette fonction est x2(3 — x)(x — 6)? et sa dérivée s’annule 


pour O0 et 1=SVS Le maximun est atteint en 15-35 et est majoré par 70. En 
conséquence : 
1 
— P <L— X6X — x 70 


|f(x) — P(x)| < 0.14 


Remarque 5.3 Un calcul à la machine montre qu'il semble que le maximum 
soit proche de 0.12 (pour x & 1.7). 
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Chapitre 6 


Accélération de convergence 


Accélération de la convergence des suites réelles 
(Jean-Etienne Rombaldi !) 


Résumé : Jean-Etienne Rombaldi nous propose un exposé clair 
et bien structuré sur la rapidité de convergence des suites et sur 
quelques procédés d’acélération de convergence. Agrémenté de 19 
exercices proposés avec leurs solutions, ce travail représente un 
moyen de s’entraîner sur ce thème pour les écrits des concours et 
d'aborder une leçon d’oral du CAPES externe encore présente à la 
session 2008 des épreuves (et dont le libellé exact est : "Exemples 
d'étude de la rapidité de la convergence d’une suite réelle (uh) 
vers une limite £ : cas où |u, — {| est dominé par n°", par q”.… 
L’exposé pourra être illustré par un ou des exemples faisant appel 
à l’utilisation d’une calculatrice."). 


Dans toute la suite, on désigne par (w,),eN une suite de réels qui converge 
vers un réel {. On suppose de plus que u, # £ pour tout n € N. Les résultats 
classiques sur les séries numériques et les intégrales généralisées sont supposés 
acquis. 


6.1 Vitesse de convergence 


Définition 6.1 Si la suite ( tone 


) est convergente de limite À, on 
Un — À neN 


dit que la convergence de la suite (un),en vers L est : 
- lente, si À = 1; 


l'Université de Grenoble, jean-etienne.rombaldi@ujf-grenoble.fr. 
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- géométrique de rapport X, si X€ ]0,1[; 
- rapide si À = 0. 


Dans le cas où À € ]0,1[, pour € > 0 tel que 0 < À +E < 1, on peut trouver 
un entier naturel n. tel que : 


— À 
Vn > ne, 0 < mate 
Un — L 
ce qui entraîne, pour n > ne : 
: Un. — L 
li = LEA SENTE net el (a+) 


ce qui signifie que la suite (lus — {|),,-,. est dominée par la suite géométrique 
(ARE) sn 


Définition 6.2 On dit que le réel À, quand il existe, est le coefficient de 
convergence de la suite (un)en : 


— 
Remarque 6.1 Si la suite — 


converge, sa limite À est alors 
Un — À neN 


nécessairement dans [0,1]. En effet, dans le cas contraire, on a 


Un+1 — 
Here: 
7 + 


Un — 


ce qui entraîne limn_ +60 [un — {| = +oo et la suite (un — L),en est divergente 
(cette suite est minorée par une suite géométrique divergente), ce qui est en 
contradiction avec la convergence de (un),en vers L. 


Remarque 6.2 Dans la pratique, on ne connaît pas toujours la limite de 
la suite (un),en, Mais dans certains cas, on peut calculer le coefficient de 
convergence À sans connaître explicitement cette limite L. 


Lemme 6.1 Si lim Un+1 — € 
n—+00 Un — À 


(Un)hen vers € est donc géométrique de rapport |A|) et s'il existe un entier 


= € ]-1,1{\{0} {la convergence de la suite 


: Un+1 — U 
no > 1 tel que un Æ Un_1 pour tout n > no, alors la suite (ane) 
Un — Un-1/ n>n0 


converge vers À. 
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Preuve. Pour tout n > no, on a : 


Mare. tr (dd) 


Un — Un-1 Un — L — (un-1 — É) 


Un+1 — f 
.: Un — £ Un — L e AE de 
bed Un — : St 
Un_—1 — À 


n — L 
(de Un Æ Un-1, on déduit que —— Z1l). 
n—-1 — 


— À n’entraîne pas nécessaire- 


Remarque 6.3 Le fait que lim 
n— +00 


. u —U : 
ment la convergence de la suite ( Ars ) . Par exemple pour la suite 
Un — Un—1|/ n>no 
(un)nen définie par ua = (—1) XP et uopx1 = (—1)P PTT avec 0 < À < 1, 
u — À 
on à lunl = À? — L=0, Hier Re = À, Un £ Un-1 pour tout n > | et; 
n— +00 Un — { 


Uop+i = op _  (—1)PXPT (IP XP  A(A-1) 


Up Up (—1PXP-(—1) IX I À+1 


Ugp4o — Up (1) APT (IP APT  A(à+1) 


Uap+1 — Up (PAP (IP XP 1-2 


Un+1 — Un 
Un — Un—1 


et la suite ( 


) est divergente. 
n>1 


Exercice 6.1 Étudier la vitesse de convergence des suites (Un)n5>2 définies 
par un = 1/n° où b > 0, uy = 1/In(n), u = a* où 0 < la] < 1, un = 1/n! et 
in 


Solution 6.1 Chacune de ces suites converge vers 0 et : 


n b 
Los 
n +1 n—+00 


- POUT Un = 1/nb, on a : 


Un+1 
Un 


donc la convergence est lente ; 
- pour Un = 1/In(n), on a : 


Un+1 
Un 


In (n) n 1 
ee Re do à 1 
m(n+1) (Est ne. 
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donc la convergence est lente ; 


- DOUT Un = A, ON à : 
1 


Un+1 
Un 


= al = À=lal; 


donc la convergence est géométrique de rapport |a| ; 
- pour Un = 1/n!, on à : 


1 
n + 1 n—+00 


Un+1 
Un 


dl 


donc la convergence est rapide ; 


- pour Un = nl/r", on a : 


Un+1 
Un 


Ce 
= a, = 
n +1 n—+00 € 
Pr à 1 
donc la convergence est géométrique de rapport —. 
e 


D'un point de vue pratique, on peut utiliser les critères suivants où l’on com- 
1 1 

are la suite (lun — £ aux suites | — —— ou (À” : 

. (um — éllaen (a n>1 (x be Qnen 


! C : À. 
- Si lun — É| Rae où © et b sont des réels strictement positif, alors la 
O0 


convergence est lente ; 


- si [un — | où C'est un réel strictement positif, alors la conver- 


4% In(n) 
gence est lente ; 
- si [un — | à CX, où C > 0 et À € ]0,1{, alors la convergence est 
OO 


géométrique de rapport À. 


Exercice 6.2 En considérant la suite définie par : 


1 

— sin = 2p 
u= ? 
— sin = 2p +1, 
n 


montrer qu’une suite convergente n’a pas nécessairement de vitesse de conver- 
gence. 
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Solution 6.2 Avec [u,| < 2 pour tout n > 1, on voit que cette suite converge 
vers Ü et avec : 


sin = 2 

——— Sin — 
Un+1 n +1 P 
Un 


n 
sin —2p+1 
2(n+1) sin p + 1, 


on voit que la suite (#21) est divergente. 
7 neN 


Remarque 6.4 L'exemple précédent montre également qu’une majoration du 


type lun — £| < 5 ne permet pas nécessairement d'avoir des informations sur 


la vitesse de convergence de la suite u. 
De même en considérant la suite définie par : 


L = À? sin = 2p 
F7 | 2X sin—2p+1 


où0O<ÀA<l,onalu,] <2A7T — Oet: 
n— +00 


Un+1 
Un 


2À sin — 2p 
= 4 À 


Donne 


n’a pas de limite. 


Exercice 6.3 Soit (ur),-n- la suite définie par : 


1 n 
Vnz L'un (1+2) Ù 
n 


Montrer que la convergence de cette suite (vers le nombre e) est lente et que 
la convergence de la suite (vn),-0 = (u2r),=0 est géométrique. 


Solution 6.3 Un développement limité à l’ordre 2 nous donne : 


: L € : 
ce qui entraîne |e — u»| dre et la convergence de cette suite est lente. 
oo 2n 


Pour la suite (v),>0 = (ua )y>0 : on a |e — val ue et la convergence est 


€ 
oo 2n+1 


1 
géométrique de rapport 9° 
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De manière plus générale, dès qu’on a un développement asymptotique de la 
forme : 

Un = L + BA? + o(X") 
avec 5 non nul et |A] dans ]0,1[, la convergence de la suite (u,),,_N vers £ est 


géométrique de rapport |A]. 
nm 


En considérant les suites (n)"),.1 ou (&) , on constate que la réci- 
neN* 


proque est fausse. 

Il ne faut pas croire au vu de l’exemple précédent que l’on peut toujours 
accélérer la convergence d’une suite (on précisera cette notion au paragraphe 
suivant) par extraction. 


1 1 1 
Par exemple les suites u — (a) iÙ— (a) — (a) 
In (n) n>2 In (27) n>1 nn (2) n>1 


1 1 
et w = | ——— = | —— convergent toutes lentement. 
(x 55). Gr . 


Par contre un développement asymptotique de la forme : 
B 1 
Un =l+—+ol — 
n pr nv 
avec B non nul et b > 0 qui assure une convergence lente donne : 


un = t+ +0 (gx) 


nb nb 
2 Mas 1 ; 
qui assure une convergence géométrique de rapport A de la suite (uar ),en : 


Exercice 6.4 Montrer que la convergence de la suite (un) définie par : 


nEN 


nm 
1 
Vn>0, un — à mÉ 
k=0 
est rapide. 


Solution 6.4 On sait que la suite (u»),-w converge vers e. La formule de 
Taylor-Lagrange nous dit que pour tout n > 1, il existe un réel cn € ]0, 1[ tel 


que : 

Cn 

E — Un = — 

n! 
ce qui donne : 


eE—U 1 efr+i 1 
DR = 


— € — 
€ — Un n+l er n+1l n—-+0 


et la convergence est rapide. 
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Exercice 6.5 Montrer que, pour tout réel a > 1, la convergence de la suite 
(un)h>1 définie par : 


Vn > 1, no 
k=1 


est lente. 


Solution 6.5 On sait que la suite (un),>1 converge vers un réel L (série de 
Riemann). Pour n > 1, on a : 


Avec les encadrements : 


on déduit que : 


+ 7 1 1 
Vn >2, L— un < : A Un—1; 
où encore : 
D l < < 1 
Va > minis (a —1)(L{— un) mp 
ce qui donne : 
1 1 
L— Un de) 


et la convergence est lente. 


Exercice 6.6 Montrer que convergence de la suite u — (u») définie par 


LS | 
US . In(n +1) pour tout n > 1 est lente. 
k=1 


nEN 


Solution 6.6 On sait que la suite (un),>1 converge vers + (constante gamma 
d’Euler). Pour tout n > 1, on a : 


“=> (if +) = it (&-5) - D 5 D” 


k=1 
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ce qui fait apparaître y comme somme d’une série, soût : 


+00 n+1 
t—n 
ie 


nt 
n=1 


et : 


et : 


ktl4_E 1 k+1 1 1 1 
St > ——_— Rs 
| pr > / RS nn 


on en déduit que : 


DU Me 


1 

el /—-Un © —. La convergence est donc lente. 
+oo 2n 

Exercice 6.7 Soient I = [a,b] un intervalle réel fermé non réduit à un point 

et f:1— TI de classe C! telle que 0 < |f!(x)| < 1 pour tout x EI. 


1. Montrer que f admet un unique point fixe L € I. 


2. Pour ug donné dans T\ {{}, on définit la suite u = (u»),en en posant 
Un+1 = f (Un) pour tout n E N. Montrer que cette suite converge vers 
£ et que la convergence est géométrique de rapport |f' (£)|. Dans cette 
situation, on dit que L est un point fixe attractif de f. 


Solution 6.7 1. Avec la continuité de f et f (1) C I, on déduit que f admet 
au moins un point fixe. En effet, la fonction g définie sur I par g (x) = f (x)—x 
étant continue telle que g(a) = f (a) — a > 0 et g(b) = f (b) — b < 0 (puisque 
fa) et f(b) sont dans T = [a,bl), le théorème des valeurs intermédiaires 
nous dit qu’elle s’annule sur I. De plus l'hypothèse —1 < f! < 1 entraîne 
g! = f'—1 < 0 sur I, c’est-à-dire que g est strictement décroissante sur T, 
donc injective, et la solution € de g(x) = 0 sur TI est unique. Ce réel L est 
l’unique point fixe de f sur I. 


2. Si uo Æ L alors un Æ L pour tout n € N. En effet, le résultat est vrai 


6.1. VITESSE DE CONVERGENCE 233 


pour n = 0 et en le supposant vrai pour n > 0, le théorème des accroissements 
finis nous permet d'écrire un+1 — { = f (un) — f (£) = (un — £) f' (cn) avec cn 
strictement compris entre u, et L et f'(cn) Æ 0, ce qui entraîne un11 Æ L. 
Le développement limité qui précède nous permet également de déduire que : 

Un+1 — { 

—_— = f'(cn) 7. PEL i]K410r, 

Un — Ê n—+00 

ce qui implique que la suite u converge vers L et que la convergence est géomé- 
trique de rapport |f' (£)|. 


Définition 6.3 Soit r > 2 un entier naturel. On dit que la convergence de la 
suite (un),en vers £ est d'ordre r s’il existe une constante À Z 0 telle que 


Définition 6.4 Une convergence lente ou géométrique est dite d’ordre 1. On 
dit aussi que la convergence est super-linéaire si elle est d'ordre r > 2. 


> Si la convergence de (u,),.N vers £ est d’ordre r > 1, alors cet entier r 
est uniquement déterminé. En effet si 


Uns1 — À Un+1 — L 
lim l'unt1 —#l ne d = À et lim Fire 4 D À = 
n—+oo [uy — Ê] n—+oo [uy — {| 
avec s > r > 1, alors 

: À 
lim [un — 4" = - 
n— +00 L 

avec À/u Z0,s—7r>0et lim} (un — £) = 0, ce qui est impossible. 

» Si la convergence de (u,),,-n vers £ est d'ordre r > 2, alors mar?) est 


équivalent à À lus — 4|"! qui converge vers 0, c’est-à-dire que la convergence 
est rapide. 


» Mais réciproquement une convergence rapide n’est pas obligatoirement 
super-linéaire comme le montre l’exemple de la suite (uh) définie par : 


21 
Um=D 
k=0 


En effet, on a vu (exercice 6.4) que cette suite converge rapidement vers e avec 


nEN 


e—u de sorte que pour tout entier r > 2, on a : 


1 
e—mn  (+) _ (m+0)7 


ES Gr Gun Au 


et la convergence ne peut être d’ordre r. 
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Exercice 6.8 Soient I = [a,b] un intervalle réel fermé non réduit à un point 
et f : 1 — I de classe C' avec r > 2 telle que | f! (x)| < 1 pour tout x € I. 


1. Montrer que f admet un unique point fixe LE T. 


2. On suppose que fW) (£) = 0 pour tout k compris ente 1 et r — 1 et 
FO (x) Z 0 pour tout x € I. Pour ug donné dans I \ {£}, on définit la 
suile u = (ün)nen PAT Un+1 = f (un). Montrer que cette suite converge 
vers { et que la convergence est d'ordre r. On dit, dans cette situation, 
que L est un point fire super-attractif de f. 


Solution 6.8 1. Voir l'exercice 6.7. 
2. La formule de Taylor-Lagrange à l’ordre r permet d'écrire que : 


() (e 
ati = 22 fun) = f (0 = (un = 9" EE 
avec Cn strictement compris entre un et L, ce qui entraîne u, # L pour tout 
n > 0 (par récurrence) et : 


Un+1 — l _ fm (£) 


FT — 


; 
n=+00 (un — £) 


20 


r! 


ce qui implique que la suite u converge vers L puisque : 


Eee Dee 


— Jim [u —4" 
+ 
et la convergence est d’ordre r. 


Exercice 6.9 On se donne une fonction g de classe C* sur un intervalle fermé 
I = [a, b] telle que g (a) g (b) < 0, g' (x) Z 0 et g' (x) Æ 0 pour tout x E I. 
1. Montrer que l’équation g (x) = 0 admet une unique solution L € Ja, b]. 


g (x) 
g' (x) 


2. On note f la fonction définie sur I par f (x) = x — 


F'(E) =0 et f”(E) Z 0. 
3. On désigne par J = [L — n,{ + n] un intervalle inclus dans T, avec n > 0, 
tel que f(x) Æ 0 pour tout x € J. Montrer que la suite u = (un),en 
g (Un) 
g' (un) 


de Newton) converge vers L et que la convergence est d’ordre 2. 


. Montrer que 


définie par uo € J\{L} et Uun+1 = Un — 


pour tout n > 0 (méthode 
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Solution 6.9 1. Le théorème des valeurs intermédiaires nous dit que l’équa- 
tion g(x) = 0 a au moins une solution dans I et l'hypothèse g' (x) Z£ 0 pour 
tout x € IT avec g' continue nous dit que g > 0 ou g' < 0 (théorème des valeurs 
intermédiaires pour g') ce qui implique que g est strictement monotone, donc 
injective. Cette solution L est donc unique. 


2. Le réel £ est l’unique point fixe dans T de la fonction f définie sur 1 par 


f(x)=x- J( . Cette fonction est de classe C? sur I avec 


g' (x) 


3. Par continuité de f" il est possible de trouver un voisinage J de L tel que 
f(x) Æ 0 pour tout x € J. La formule de Taylor-Lagrange à l’ordre 2 permet 
d'écrire que : 


2 f" (Cn) 


Un+1 — Ê = fun) — f(£) = (un — £) D] 


avec Cn strictement compris entre un et L, et f” (cn) Æ 0, ce qui entraîne 
Un £ L pour tout n > 0 (par récurrence) et : 


im mHirt _ SO _ d'@) 


= 7 0, 
n— +00 (ur = ni 2 2g! (£) 7 


ce qui implique que la suite u converge vers L puisque 


f” (cn) 
2 


n— +00 lun — | n— +00 


= 0, 


et que la convergence est d’ordre 2. 


6.2 Accélération de la convergence 


Définition 6.5 Si v — (v),en est une autre suite convergente vers L avec 
Un £ L pour tout n € N, on dit que la convergence de cette suite vers L est plus 


| ï 2 Un — 
rapide que celle de u = (un)hen st AU Er = (. 
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Accélérer la convergence d’une suite consiste à construire à partir de cette 
dernière une autre suite qui converge plus vite vers la même limite. 


Exercice 6.10 Soit (ur),-n+ la suite définie par : 
1 n 
Vn > 1, un = (+2) : 

n 


Montrer que la suite (w),>0 = (u2r),>0 permet d'accélérer la convergence de 

cette suite. 

Solution 6.10 On a vu (exercice 6.3) que e — un de > (convergence lente) 
OO 


CLÉ Un et (convergence géométrique) de sorte que : 
+00 


à Un — € : 
lim = Jim ar 
n—+00 Un e n—+oo 27+ 


= (0. 


De manière plus générale, un développement asymptotique de la forme : 


B 1 


avec 5 non nul et b > 0 donne : 


1 
sun 04 5 +0 (2) 


3 Un — L $ n° 
et lim — lim — — 
n—+00 Un — Î n—+oo 2nb 


0. 


Mais l'extraction ne permet pas toujours d’accélérer la convergence d’une suite. 


= tu = | —— 
In (n) n>2 (x (n?) n>2 


Un 1 


Par exemple pour u = ,0n a 


INA: 
n—+co Un In(2) 
L'exercice qui suit nous donne un procédé élémentaire, mais peu performant, 
d'accélération de la convergence, l’idée étant de remplacer chaque u» par une 
moyenne pondérée de u, et un11. Ce procédé sera affiné par la méthode de 
Richardson. 


Exercice 6.11 Soit À un réel différent de 1 et v — (vy) 
par : 


nen la suite définie 


Un+1 — AUn 


Vn > 0, u = 
ME be 


(Un est un barycentre de un+1 et Un). 
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1. Préciser pour quelles valeurs de À et à quelles conditions sur u la suite v 
converge vers L plus rapidement que u. 


Te 
2. Appliquer ce procédé à la suite u = [e + x) | en précisant la 
neN 


vitesse de convergence de la suite accélératrice v obtenue. 


Solution 6.11 Pour À = 0, on a Un = Un+1, ce qui n’a pas beaucoup d'intérêt. 
1. Pour tout réel À différent de 1, la suite v converge vers L et : 


brel us t= Aie 1 Uupr1 — L À 


end Re) 7 LANGE LEN 
de sorte que : 
n n+1 — Ê 
a de 
n—+00 Un — n—+00 Un — Ÿ 


On a vu que la convergence de u vers L impose À € [-1,1] et comme À Z 1, on 
déduit que la suite v converge vers L plus rapidement que u si, et seulement si, 


— À 
Em HT =)er-11l 
n—+00 Un — À 
e Pour À — —1, on a Un — et cette suite accélère u si, et 
Un+1 — l 


seulement si, u converge lentement avec lim = —]1. 


n—+00 Un — 
e Pour 0 < |A] < 1, la suite v accélère u si, et seulement si, la convergence 


tee 


de u est géométrique de rapport |] avec lim 
n—+00 Un — { 

2. On a vu que la convergence de la suite u vers e & 2.718281828 est 
géométrique de rapport À = 1/2 (exercice 6.3), ce qui donne la suite v définie 
par : 

Un = 2Un+1 — Un. 


nn) 


Le développement limité à l’ordre 2 de exp au voisinage de 0 


nous donne le développement asymptotique : 


CR 
n ss. 22 24n? : n? 


et : 
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puis : 
: 11 1 1 
Un € Lg on © 92n 
On a donc 
11 1 
T5 


et la convergence est géométrique de rapport 1/4. Pour n = 1, on à u1 = 2.25, 
V1 & 2.63281250 et pour n = 6, u6 = 2.697344953, v6 & 2.718133087. 


Exercice 6.12 Considérons l’approximation du nombre x par la méthode d’Ar- 
chimède des polygones réguliers. Cette méthode consiste à introduire la suite 


(un)h>1 définie par : 


Vn > 1, un = 2" sin (x) . 


1. Montrer que la suite (un}n>1 est aussi définie par : 
U1 — 2, 


2 
Un > 1, uni = V22"4/1— 1-(5) 


Cette relation de récurrence permet un calcul itératif des u» sans utiliser 
le nombre tr que l’on veut approcher. 


2. Montrer que la convergence de cette suite vers x est géométrique de rai- 
son 1/4. 


3. Utiliser le procédé décrit à l’exercice précédent pour accélérer la conver- 
gence de cette suite en précisant la vitesse de convergence de la suite 
accélératrice v obtenue. 


Solution 6.12 1. Avec : 


. 2 T _ 
— Ce 


on déduit que : 
HN 
Vn > 1, Ungt = arf ER 


2. En utilisant le développement limité : 
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on obtient le développement asymptotique : 
TE 1 
Ve an 0 (52 


Cette suite converge donc vers Tr et la convergence est 


3 


’ T 
TU Spam 
géométrique de raison 1/4. 


3. En utilisant le procédé décrit à l’exercice précédent, on accélère la conver- 
gence de cette suite en posant : 


Aüun+1 — Un 


V dd n — 
n>1,v 3 


En poussant le développement limité précédent un peu plus loin, on a : 
sin (x) = x — — + — +o(x) 


et le développement asymptotique : 
Re CR 1 
UT gr am À prom  °( om 
7° 3: 1 1 
ET Sao tO(om 


73 1 
oo 5! 4247" 


qui donne : 


soit 


I —V 


Cette suite converge donc vers r et la convergence est géométrique de raison 
1/16. 


Dans le cas où on dispose d’un encadrement de la forme : 
où (Eh )nen €t (En)hen Sont des suites convergentes vers 0, la suite (va),en 
définie par Uy — un — €}, converge aussi vers L avec 0 < uy — L < ôn = En —€/, 


ce qui fournit parfois une suite accélératrice. Les exercices qui suivent nous 
fournissent des exemples de telle situation. 
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Exercice 6.13 En utilisant l’encadrement obtenu avec l’exercice 6.4, montrer 
que la suite (vn),>1 définie par : 


Vn > 1, Un — S : + L 
ON A LEE FREE 
= À! nn! 


accélère la convergence de la suite (un), =, définie par : 


| 
Vn > 1, Um D y 
k=0 


Solution 6.13 On a obtenu (exercice 6.4) l’encadrement : 


De 
qui donne : ; ; : 
PRE Get mc cenl 
et : 
pere = D 


E — Un 7 ND n—+o 


On a par exemple : 


5 
1 
U5 = S— SR 2.717167, V5 = U5 + 


1 
HI BxBl & 2.718353. 


5 *x 5 


Exercice 6.14 En utilisant l’encadrement obtenu avec l’exercice 6.5, montrer 
que la suite (un), définie par : 


1 1 


n 
1 
Vr2bans D pet ane De 


k=1 


accélère la convergence de la suite (un), définie par : 


n 

1 

Vn > 1, Un = D pe 
k=1 


Solution 6.14 On a obtenu (exercice 6.5) l’encadrement : 


SE 


ner ou 


nel? 
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qui donne : 
a—1 _ ,,a—1 
Get étend ED — 
a—1l nel(n+1) 
et : ; 
- a-1 _ ,ja-1 - 
o<! De CU) n nie o. 
L— un nai +00 ND  n—+00 


Exercice 6.15 En utilisant l’encadrement obtenu avec l’exercice 6.6, montrer 
que la suite (vn),>1 définie par : 


— 1 
vhs ) x Mmn+1)+ 
k=1 


1 
2(n +1) 


accélère la convergence de la suite (un), =, définie par : 


es | 
Vn > 1, un — —In(n+1 
> DE (n +1) 


Solution 6.15 On a obtenu (exercice 6.6) l’encadrement : 


1 1 
2(n+D T7 
qui donne : 
1 
0 < < 
RU 2n(n +1) 
et : : 
DE RÉ =. 0 


6.3 Méthode d’accélération d’Aitken 


Pour ce paragraphe, on suppose que suite (ur),-N converge vers un réel £ 
(toujours avec un Z£ L pour tout n € N) avec : 
2. URI 
Fig 


n—+oo Un — 2 


= Xe]-1,1[\{0} 


c’est-à-dire que la convergence est géométrique de rapport |A]. On suppose de 
plus que un+1 Æ Un pour tout n € N. 
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On à vu avec l'exercice 6.11 que la suite v — (v,),,.N des moyennes pondérées 
définie par : 

_— Un+1 — Un 

1— À 

est une suite accélératrice de u. 
Mais dans la pratique le coefficient À peut être prévu sans connaître explici- 
tement sa valeur, de sorte que ce procédé d’accélération n’est pas utilisable 
directement. 
Un exemple typique d’une telle situation est fourni par une suite d’approxi- 
mations successives d’un point fixe attractif { d’une fonction f de classe C}, le 
coefficient À = f’(£) qui fait intervenir le réel £ qu’on cherche à approximer, 
étant inconnu dans |—1,1[\ {0} (voir l'exercice 6.7). 
La méthode d’Aïtken nous permet de construire une suite de réels (3),en 
qui va converger vers À et on définira une suite accélératrice par les moyennes 
pondérées : 


On rappelle que la suite (A»),,ew+ définie par : 


Un+1 — Un 
Vn e N°, À, = ti Un 
Un — Un—1 


converge vers À (lemme 6.1). Comme À < 1, il existe un entier no tel que l’on 
ait À, < 1 pour tout n > no. On peut donc définir la suite (v,),,-,, par : 
Un+1 — AnUn 
NE NDS = — 
z NO; Un T= sa 


Théorème 6.1 La suite (v,) converge vers { plus rapidement que la suite 


n>no 
(Un)nen . 


Preuve. Pour tout n > no, on a : 


Un+1 — An Un 


— À 
LE 1 An » 1 Un+1 — Ann — L(1 — À») 
Un — L Un — À CFE Un — L 
: Al Un+1 — À 
e entrer x), 2,0 
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En utilisant la définition des À,, on peut écrire chaque terme de la suite accé- 
lératrice de Aitken (v,) sous la forme : 


n>no 
2 2 
Un41lUn-1 — U (Un — Un-1) 
Un — = Un ——_— ss —— — 
Un+1 — 2Un + Un-1 Un+1 — 2Un + Un—1 
Un+1 — Un 


< 1, on à (Un+1 — Un) — (Un — Un-1) Æ 0 et le 
Un — Un—1 


dénominateur de v, est bien non nul). 
En introduisant les opérateurs de Aitken A et A? définis par : 


AUn = Un+1 — Un 
L'un = À (Au) = Un12 — 2Unr1 + Un 


On à : 5 
eo (Aun) 
Un+1 — Un — EXT Ê 


Exercice 6.16 Soit (ur),en une suite arithmético-géométrique définie par 
uo ER et Un+1 = Aun + b où a,b sont des réels donnés avec 0 < |a| < 1. 


1. Montrer que u converge ver £ = 1 et préciser sa vitesse de conver- 
— & 


gence dans le cas où uo £ L. 


2. Décrire la suite accélératrice de Aitken correspondante. 


Solution 6.16 1. Si cette suite converge, alors sa limite est solution de l’équa- 
b 
tion x = ax +b qui a pour unique solution £ — a De Un+1 = aun + b et 
L = al + b, on déduit que un+1 — { = a(un — L) et par récurrence 
Un — L = a" (uo — L), 


soit Un = £ + a” (uo — É) et lim Un = L avec un £ L pour tout n > 0 et 
N— +00 


Un+1 — l 


Un — Ê | 


c’est-à-dire que la convergence est géométrique de rapport |al (ce qui n’est pas 
étonnant). 

2. On à Un+1 — Un = à” (uo — L) (a — 1) et Uun+1 — aun = b =L(1—- a), de 
sorte que : 


Un+1 — Un Un+1 — An Un 
Àn = —— = à et Un = ——— "© = À, 
Un — Un—1 1)» 


La suite v est donc stationnaire sur L. 
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Exercice 6.17 On reprend la situation de l’exercice 6.7 avec T = [a,b] et 
f:1—1T de classe C? telle que 0 <|f'(x)| < 1 pour tout x € I. 

On a vu que cette fonction admet un unique point fixe (attractif) L E T et que 
la suite u = (un),en définie par uo € I\ {LE} et un+1 = f (un) pour tout n > 0 
converge vers L avec un Z£ L pour tout n € N, la convergence étant géométrique 
de rapport |f' (£)|. 

Montrer que, si f" (4) £ 0, alors la convergence de la suite accélératrice v de 
Aitken correspondante est géométrique de rapport (f' (£))°. 


Solution 6.17 Un développement limité à l’ordre 2 en L nous donne, en te- 
nant compte de f (£) = £ : 


OO RE) CE) 


2 
0 


En notant en = un —{, = f'( etn 5 


, cela s'écrit : 


En = Àen-1 + es +o (ea) 


et, en désignant par (vn)y>n, la Suite accélératrice de Aitken, on a : 


ur re 


avec : 
AUn-1 = Un — Un-1 = En — En-1 
A = Un+1 — 2Un + Un_1 = Ent1 — 2En + En—1 
ce qui donne : 
DS 
L ee En+1 — 2€n + En—1 
avec : 
En — En1 = (À —l)en 1 + ue ; +o(ei_;), 
(en — en-1) = (À —-1) 1 + —1)e 1 +o(es 1), 
Ent1 — En = À(À — 1)en-1 + ((À —1)u + Yu) e 1 +o(e_1), 
En+1 — 2En +En_1 — (ia ns én) — (es va Gn) 
= (A1) en1 + (A1) (A +2) pers +o(eñ_1) 
et donc : 
(À — 1)en-1 + 2uei_; +o(ei_:) 
A =D +40 + D en-1 + 0(en1) 
___Au+o(l) e2 
7 (à=1)+0(1) 7 


Un — L = En_1 — 


1- 
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Où encore : 
lim 2 Le ae. 
n— +00 LR Et 
Comme f"(L) ÆZ0,onauZ0 et: 
Au 2 _ f'(Of"() 2 
Un Ne CN n—1: 


On a donc : 


2 
Un+1 — l En 2 ! 2 
— à nm À°= BTS 
Un — L  +co (=) +00 (f ( )) 
En définitive, on est passé d’une convergence géométrique de rapport |f' (£)| à 


une convergence géométrique de rapport (f' (2) , ce qui confirme l'accélération 
de la convergence puisque |f' (2)| < 1. 


Remarque 6.5 Si, avec les notations de l’exercice précédent, on désigne pour 
tout entier naturel n, par M, le point de R? de coordonnées 


(uns F (un)) = (uns Un+1) 
dans la base canonique, la pente de la droite (M, M1) est : 


5, = Un? Untl | An+1 


Un+1 — Un An 
et l'équation de cette droite est : 
Au 
YU = Un+1 + CEE (x — un). 


Le point d’intersection de cette droite avec la première bissectrice est le point M}, 
de coordonnées (ïn, Zn) Où Zn est solution de : 


T = Uns1 + = (x — un) = Aun + Un + —— (x — Un) 
soit de : ru 
(t — Un) (:- A ) ANT 
ce qui donne : 
Au Aun)? 
Éd T Le us ne a 
__— (Aun)° : 
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Remarque 6.6 Pour la programmation de la méthode de Aitken on peut re- 
marquer que les Un s’écrivent aussi : 


1 1 <. 
Un = Un + ; 
Un+1 — Un Un — Un—1 


En effet, on a : 


2 
Un+1Un-1 — Ur 


Un+1 — 2Un + Un-1 
(ün+1 = Un) (un EE is) 
(ui me ün) = (Un 2 Tr) 
1 
1 1 


Un+1 — Un Un — Un—1 


Un — 


n 


= Un + 


Dans le cas où la suite (u»),-n est une suite d’approrimations successives 
définie par un+1 = f (un) (avec les notations et hypothèses de l'exercice précé- 
dent), en définissant la fonction g par 


1 
Je— 
f(x)-x 
pour x € I\{L}, les v, peuvent se calculer comme suit : 
Un — É (un_1) ; 
1 
Un = Un + 


9 (un) — 9 (Un-1) 


Exemple 6.1 On s'intéresse aux points fixes de la fonction f : x + e * sur 


[0,+oo[. Cette fonction est indéfiniment dérivable, strictement décroissante 
sur [0,+oo[ avec f’ (x) = —e-* et f ([0,+oo[) = ]0,1]. 
En posant I = [e”},1] = [0.36788,1], on a f (1) = ner | c let 
0 < |f'(æx)| < À = el < 1 pour tout x € I. La suite (un),yen définie par 
uo = 0.5 et un+1 = f (un) pour tout n > 0 converge donc vers l’unique point 
fixe LE Ï, la convergence étant géométrique. 
Le programme Maple qui suit nous donne les valeurs des un et vn pour n 
compris entre 1 et 15 : 

restart ; f :=x->exp(-x); g :=x->1/(f(x)-x) ; à :=0; x :=0.6; 

for n from 1 to 15 do 

til; z io); red) r =; 
od ; 
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Ce qui donne les valeurs suivantes : 


u1 = 0.6065306597 u14 = 0.5671188642 u15 = 0.5671571437 
v1 = 0.5676238764 V14 = 0.5671432906 v15 = 0.5671432905 


On constate que la convergence de la suite (v»),en vers le point fixe de f, 
{= 0.567143290409, est plus rapide que celle de la suite (un)yen : 


En utilisant f = —f, f" = f et f (8) = £, on a ici : 


HOMO RS ETS. 


MT D 2(1— f(0) "2(1+4 


QUEC : 


2 & 0.321651511855947 


2 


l 
= = 0.102623516887215. 
2(1+0 


Dans le cas d’un point fixe super-attractif (c’est-à-dire que f’(£) = 0), en 
supposant de plus que f” (£) Z 0, on a, pour f de classe C4, le développement 
asymptotique suivant de l’erreur d’approximation : 


Én=oë pp As ue. Lo (é à) ; 


où on à noté : 


_i'@ | _10@ 


2 5 » A3 3! 


, À — ; 


ce qui donne : 


(en és) met. 0) (X —2)13)e%_; +o(el_:) 


À2e? + o (e2) — En 
= —Me_ — 3661 + (NM) ei +o(es 1) 


En+1 — 26n + En-1 = En-1 — 2)2e2 _: . 21365 + (X — 214) es + 0 (eñ_:) 


En+1 — En 


et : 
- —X +o(1) 3 2 3 
TPS er co) ET (+0) enr, 
soit : . 
L CO) 3 
ve (un 0). 
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Avec 
Un — L= (—-X5 +o(1))e_;, 
dun £= (-X+0(1))e = (-xÿ+o(1)) és, 
on déduit que : 
Dee", LP) 
(Un — Le 2 


La convergence vers { de (v:),,-,, est donc, comme celle de (un) 
mais cette convergence est quand même plus rapide. 


ne d'ordre 2, 


Exercice 6.18 Donner une expression de la suite accélératrice de Aitken pour 
la suite (un), >, définie par : 


n 

1 

Vn > 1, Un = D re 
k=1 


où a > 1. Préciser la vitesse de convergence de cette suite accélératrice. 
Solution 6.18 On a : 


AUn = Un+1 — Un — 


Aun = À (Aux) = 


et : 
© een (n +2) 
HET AE, (a+ (n +92) (n +1) 
9 [02 
= Un + us ) 


DAC RD) 
Par exemple, pour n = 2, on a : 


(n +2) 
(n +1)? (2n +3) 


Un+1 = Un + 


En reprenant les calculs de l’exercice 6.5, on a pour tout n > 1 : 


1 1 d, 
a—1l < À Un < 
a—l(n+1) 


a—lna-l 
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et donc : 
1 : (a—1)(n+2)° = 
(a—1)(n+1)% "1 Gi ns) £É— Vn+ 


(1 = mr) 
= Ta=1}na-T (n+1) ((n+2)%—(n+10)7 


avec : 


ce qui donne : 


n°1 (a — 1) A 

(n +1) (G- (#8) ee na a 
et : (@-1) _—. 
(n +1) G-(#8) ue ne a 


Il en résulte que : 


de] 1 
Lo © ir SE 
PT n+oo (an a a(a—1)}na-t 


et la convergence de la suite (wn),>1 est lente. 


6.4 Méthode d’accélération de Richardson 


On se place dans un premier temps dans le cas où on dispose d’un développe- 
ment asymptotique de la forme : 


Un = Ê+ BA + qu" + o(u”) 
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avec 5,7 non nuls et 0 < |] < [À] < 1. La suite (uw), converge donc vers £ 
et la convergence est géométrique de rapport |À|. 

Si on connaît explicitement les coefficients 6 et À, on peut accélérer la conver- 
gence de la suite (u,),,-N en la remplaçant par la suite (v,),,-n définie par : 


Un = Un — BA”. 


Cette suite converge bien vers L et avec vu, — L a y”, la convergence est donc 
OO 


géométrique de rapport [ul et : 


= + à (y n—+00 ds 


ce qui confirme bien que la suite (w1),,.N converge vers £ plus vite que la suite 
(Un)nen : 

Si on connaît explicitement le coefficient À, mais pas le coefficient 6, on peut 
définir un barycentre de u,11 et u, où le terme BA" à été éliminé. Pour ce 
faire, on écrit que : 


Uni = + BAT + RH (4 + o(1)) 
Un = £ + BA + y (y +o(1)) 


et : 
Un+1 — Aun = (1 À)£+ HT ((u— À)7+o(1)), 


ce qui nous conduit à introduire la suite (v,),-N définie par : 


nEN 


Un+1 — Un 
1—À 


Un — 


C’est la situation décrite à l’exercice 6.11. 
On a alors : 


_ nmfH—à D HTÀ on 
RE (Er tou) RS DENT 


c’est-à-dire que la convergence est géométrique de rapport [u| et : 


Un — L u—À7 ( y o 
CA) 
Un — L +oo 1— À \À/ n—+00 
On est donc ainsi passé de la suite (u,),,-n qui converge vers £ avec une vitesse 
de convergence géométrique de raison || à la suite (w»),,n qui converge aussi 
vers £ avec une vitesse de convergence géométrique de raison [ul] < |}. 


Les exercices 6.11 et 6.12 nous donnent des exemples de cette situation où on 
approxime respectivement les nombres e et T. 
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De manière plus générale, si on dispose d’un développement asymptotique de 


1 
nm nm nm 


la forme : 


avec Ê et 7 non nuls, on utilise la suite (v,),en = (t2r),en pour laquelle on à 
le développement asymptotique : 


et une suite accélératrice est définie par : 
Un = 2Un+1 — Un. 


On a alors : 


Wn — 

1 à : ;] ul 2 2 . . N 
c’est-à-dire qu’on passe d’une convergence géométrique de raison 1/2 à une 
convergence géométrique de raison 1/4 (voir l'exercice 6.11). 


La méthode de Richardson consiste à itérer le procédé précédent dès que l’on 
dispose d’un développement asymptotique de la forme : 


p+l 
Un =L+ IN B;X+o (x) 
j=1 


où p est un entier naturel non nul, les coefficients 8; sont tous non nuls et les 
coefficients À; tels que : 


Ds A bee RIT 


Si tous les coefficients B; et À; sont connus, on peut accélérer la convergence 


de cette suite en introduisant la suite (v,),,N définie par : 


p+1 


nm 
Un = Un — ) Le 
j=1 


Ce cas se présente pour les sommes de séries numériques de la forme RUE (n), 
où la fonction f est indéfiniment dérivable sur RT*. Le développement asymp- 
totique est obtenu en utilisant la formule d’Euler et Mac-Laurin en supposant 
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le calcul explicite des dérivées de la fonction f facilement réalisable. C’est le 
cas par exemple pour les séries de Riemann convergentes. 

Si les coefficients À; sont tous connus, mais pas les coefficients B;, on va les 
éliminer progressivement en itérant le procédé barycentrique décrit précédem- 
ment, ce qui nous amène à introduire, pour tout entier k compris entre 0 et p, 
les suites (u,,x),en définies par les formules de récurrence suivantes : 

Un,0 — Un; 
Un+1,8—1 — ÀkUn,k—1 
1 — Ày ‘ 


Un,k — 
Lemme 6.2 Avec les notations et hypothèses qui précèdent, on a pour tout 
entier k compris entre 0 et p, le développement asymptotique : 


p+1l 


Un,k = Ê + ÿ B3,5X +0 (ou); 
j=k+1 


les coefficients By; étant tous non nuls. 


Preuve. On procède par récurrence finie sur k.Pour k& = 0 c’est l’hypothèse. 
En supposant le résultat acquis au rang k — 1 < p,on a: 


ss +1 nl 
n nm 
Un+1k1 = Ê+ D Bi; +0 (5H) 
i=k 


p+1 
Un,k—1 = £ + 2 Bei +o (15) 
I—= 


l'élimination du coefficient B;_,, entre ces deux équations se faisant avec : 


p+1l 


u 1 — ÀKkün.k- 
n+1,k — < kUn,k—1 pr >» be 20 ss Gr) 
: j=k+1 
Àj — À 
Où By; = Tan Z 0 pour tout j compris entre k+1etp+1. m 


Théorème 6.2 (Richardson) Avec les notations et hypothèses qui précèdent, 
pour tout entier k compris entre 1 et p, la suite (un. x),en converge vers { plus 
rapidement que la suite (Un,k-1)heN ? la convergence de la suite (Un k)neN étant 
géométrique de raison |Ag+1|. Plus précisément, pour tout k compris entre 0 
et p, on à : 


Ung—l À? 
n,k ro Brk+1 +1 
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avec : ; 
Àk+1 — À; 
Brk+1 = Pr I[  ——— 
, 1—); 
j=1 
Preuve. Avec l'hypothèse 0 < [1541] < :-: < [Axy1l < [Az] et lemme précé- 
dent, on déduit que, pour k compris entre 1 et p, on a : 


UnE-Lle À? 
n,k LUE Bxk+1 k+1 


nm 
Un,k — L Brp+1 [Arr 
RU, ERktl [ AkHI La. :Ù 
Un,k—1 — £ +00 B-18% À& n— +00 


avec : 
8 Ati Ag Ari Ag AH À g 
jus, 1 — À& 1 — Àg_1 1—-ù jus 


ce qui est le résultat annoncé. = 


Exercice 6.19 On reprend l'exemple de la suite d’Archimède u = (un),>1 
permettant d'approcher le nombre mr. On rappelle qu’elle est définie par : 


Value =2"Ssin (5) 


(exercice 6.12). 


1. En utilisant, pour p > 1, le développement limité à l’ordre 2p de la 
fonction sin, donner un développement asymptotique de la suite u. 


2. En déduire les suites accélératrices correspondantes à la méthode de Ri- 
chardson. 


Solution 6.19 1. Avec le développement limité : 


sin (Tx) S 1ÿ LR +o(a2t?) 
= 1) — xt +o(x 
TT — (2j +1)! . 


on obtient le développement asymptotique : 


p+1 ; rit 1 n 1 n 
mL gens) +5) ) 
2. Les suites accélératrices correspondantes à la méthode de Richardson sont 
donc données par : 


T 
Un:0 = = 27 sn (5): (n > 1) 


Un+1,k-1 — Un k-1 Lun+1,k-1 — Un,k—1 
RS = ue = cn Oo aan 
es 4 2] 


(ER Spa Tl): 


254 CHAPITRE 6. ACCÉLÉRATION DE CONVERGENCE 


L'exercice précédent peut se ramener à la situation suivante. On dispose d’une 


fonction f définie sur Z = ]-1,1[ et admettant un développement limité d’ordre 
p+len0: 
p+1 | 
f(a)=e+ 3 Bjr) +o(a”t) 
j=i 


où p est un entier naturel non nul et les coefficients 8; sont tous non nuls. On 
associe à cette fonction la suite (u,),-, définie par : 


bed 'ui= ir 
où r est un réel non nul dans |-1,1[. On a alors le développement asympto- 


tique : 
p+1l 


Un no. X} +0 (A1) 
où les coefficients À; = r/ vérifient bien l'hypothèse : 
0 < lApy1] < [pl <°:- < [A] < 1 


On peut donc définir les suites accélératrices (u,,x),5, par : 


Un,0 = Un = f (r*) 


k 
Un+1,k—1 TT Un,k—1 


due 1<k<p). 
Les coefficients 8,341 sont alors donnés par : 
k_  k+1 j Ro LkHi-5 _ 


— ri | 
Bei — Si [T —— = Oyy Il r? ee 
r* =] k—1 _ 1 
5 en enr 0 


Dé Eu vob _ (—-1)fr 2 Bi 


On a donc, pour tout Æ compris entre 0 et p : 


(&+1)(2n+k) 
— (SA) —] k 2 
UE Eau )" Br+ir 


Pour la suite d’Archimède, on a : 


Vn > 1, an = Pain (5) = (7) 
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: 
où f (x) = nt) et en écrivant f (x) = g (x?) , où : 


pri _ r2i+l 


g(t)=r+ > (—1} Gene +o(xti) 


: à 1 
on se ramène à la situation précédente avec r — 2 On a alors, pour tout k 
compris entre 0 et p: 
n°43 1 


TRE oo (2k + 3)! 20 DE D 


On a, par exemple, pour les trois premières suites : 


Un = 2" sin (à) ; 


Aün+1 — Un 
Uni = 5 — ; 
Tr 16un+1,1 — Una 
; 15 
avec : - 
7° 1 
FU Le 6 ar 
m$ 4 
F5 16n1 
nm? 1 
T — Un,2 te 71 Gar+ 1" 


Exemple 6.2 Si on reprend l’exemple du nombre e approché par la suite 
(Un)h>0 définie par : 


Le 
Vn > 0, m=(1+%) , 


1 
On a un = f (x) , où f est la fonction définie sur |—1,1[ par : 


1 Inite) 
(1+z)r =e = si0</|x| <1, 


Cette fonction est indéfiniment dérivable sur |—1, 1[ comme composée des fonc- 


tions : 
+00 n—1 


n(l+x 541 
ge SCD LYC) L 
k=1 
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ettt- e', elle admet donc des développements limités à tous ordres en 0. Par 
exemple, à l’ordre 3, on a : 


In(1+zx) 


e ? —=e— 


1 
On peut donc utiliser le procédé d’accélération de Richardson avec r — 7» € 


qui donne les suites accélératrices définies par : 


D 


k 
D RE ES 


Un,0 = Un = (+ 


Un,k — ok] (k>1), 
et on à : 
k 
Unk—e (—1) Pete 


Ce qui donne, par exemple, pour les trois premières suites : 


Un,1 — 2Un+1 — Un; 
_ Aun+1,1 — Un, 


Un,2 — 3 ; 
avec : 
e 1 
FT RES 2m 
lle 1! 


RS on 


7e 1 
Loo 16 23in+1]° 


€ — Un,2 
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Chapitre 7 


Matrices toutes puissantes 


Matrices toutes puissantes. 
(Arnaud de Saint Julien!) 


Résumé : Dans la RMS d'octobre 2005, Gabriel Dospinescu 
pose la question Q535 : déterminer les matrices carrées À telles 
que pour tout n € N*, il existe une matrice B à coefficients ration- 
nels telle que À = B”. Nous allons répondre à cette question mais 
aussi proposer quelques prolongements. 

Dans tout l'exposé, K désigne un corps commutatif. Une matrice 
carrée À est dite toute puissante sur K (en abrégé TPK), si pour 
tout n € N*, il existe une matrice B à coefficients dans K telle que 
A = B". On remarque déjà qu’une matrice toute puissante sur K 
est nécessairement à coefficients dans K. 

L'objectif de cet article est de déterminer les matrices toutes puis- 
santes dans le cas où K désigne C, R, Q ou un corps fini. 

Avant de démarrer je tiens à remercier vivement Vincent Beck pour 
sa précieuse relecture. 


Mots-clés : bijection, unipotent, nilpotent, image de l’exponentielle de ma- 
trices complexes et réelles, réduction de Dunford, réduction simultanée, racines 
carrés de matrices, extensions cyclotomiques, corps finis. 


7.1 Le cas instructif de la taille 1 


Commençons par examiner ce qui se passe en taille 1, c’est-à-dire dans le cas 
des nombres. 


Lycée La Merci à Montpellier, France, desainta@yahoo.fr. 
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Sur € la situation est extrêmement simple. 0 est bien sûr TPC puisque 
pour tout n € N*, 0 = 0". Si a € C*, a = reŸ = e""#8, G est donc une 
exponentielle, ce qui permet d'écrire 


In r+3i0 
@ —= (e n L 


Tous les nombres complexes sont donc TPC. 


Remarque : En fait sur un corps algébriquement clos, tous les nombres 
sont tout puissants puisque pour tout n l'équation x” = a admet une solution. 

Sur R, c’est presque aussi simple. Un nombre TPR est en particulier un 
carré. Réciproquement, si a non nul est un carré, a > Oeta—=eMa={en }". 
Les nombres TPR sont donc les nombres réels qui sont des carrés. 


Sur Q, la situation est plus délicate. Si a € Q et a > 0, on peut toujours 
Ina Ina L x . 
écrire a = (e » }”, le problème c’est que e » n’a aucune raison d’être rationnel. 
Le théorème suivant nous apporte la solution. 


Théorème 7.1 Les nombres tous puissants sur Q sont 0 et 1. 


Preuve : 0 est bien sûr tout puissant puisque pour tout n € N*, 0 = 0". 
Un nombre tout puissant a est en particulier un carré, il est donc positif. 
Soit a > 0 un nombre tout puissant que l’on écrit en le décomposant en produit 
de facteurs premiers : 

ie II pr(a) 


pEP 


où P est l’ensemble des nombres premiers, et où les v,(a) sont des entiers 
relatifs presque tous nuls. Si on a a = b”, on voit en décomposant b sous la 
même forme, que v,(a) = nv,(b) (par unicité de la décomposition en produit 
de facteurs premiers), donc v,(a) est divisible par n et ce pour tout n puisque 
a est tout puissant, donc v,(a) = 0 pour tout p, donc a = 1. Réciproquement 1 
est bien tout puissant sur Q puisque pour tout n € N*, 1 = 1”. 


Sur un corps fini F,, c’est simple aussi. Si a € F, est tout puissant non nul, 
il existe en particulier b non nul tel que a — b17! — 1 puisque le groupe des 
inversibles du corps F, est cyclique d'ordre q — 1. Les nombres tout puissants 
sur un corps fini sont donc 0 et 1. 


Donnons enfin une conséquence facile mais néanmoins très utile : 


Proposition 7.1 Le déterminant d’une matrice TPK est aussi TPK. 


7.2. GÉNÉRALITÉS 261 


Preuve : Si À est TPK, pour tout n € N* il existe une matrice B à co- 
efficients dans K telle que À = B". Par multiplicativité du déterminant, on 
a donc det À — (det B)” avec det À et det B à coeffcients dans K, d’où le 
résultat. 


Cette étude des nombres tout puissants nous laisse envisager que dans le cas 
général l’exponentielle de matrice va jouer un rôle et que sur Q des propriétés 
arithmétiques seront mises en jeu. 


7.2 Généralités 


7.2.1 Dévissage du problème par théorème spectral caracté- 
ristique 


Dans tout cet l’exposé, p est un entier naturel non nul et 1, est la matrice 
unité de M,(K). 

Le théorème de décomposition des noyaux et un argument de réduction simul- 
tanée vont nous permettre de dévisser les matrices toutes puissantes en blocs 
plus simples tout puissants. Le petit lemme suivant est à cet égard fondamen- 
tal : 


Lemme 7.1 Soit E un K-espace vectoriel et u et v deux endomorphismes 
de E qui commutent. Pour tout polynôme Q € K[X], v laisse stable l’espace 
vectoriel Ker Q{(u). En particulier, v laisse stable les sous-espaces propres et 
les sous-espaces caractéristiques de u. 


Preuve : Par commutation, Q{u) o vu = vo Qu). Soit x € KerQ(u), 
Q{u)(v(x)) = v(Q{(u)(x)) = v(0) = 0; ce qui prouve la stabilité. Si À est 
une valeur propre de « de mutiplicité &, le lemme appliqué à respectivement 
Q(x) = X — Xet Q(x) = (X — À)® montre que vw laisse stable les sous-espaces 
propres et les sous espaces-caractéristiques de u. 


Remarque : Puisque u commute avec lui-même, on obtient en particulier 
que u stabilise ses sous-espaces propres et ses sous-espaces caratéristiques. 


Proposition 7.2 (Théorème spectral caractéristique et dévissage) 
Soit À € M,(K) une matrice de polynôme caractéristique XA scindé sur le 
corps K. Si x4 = (X — A1)%1...(X — ÀZ)% alors, 


1) A est semblable sur K à la matrice diagonale par blocs 
diag(A,, +N,..., Xe + Ny) 


avec pour à € {1,...,k},p: = dimKer(A — X1,)% et N; € M,,(K) nüpotente. 
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2) A est TPK si et seulement si pour tout i € {1,...,k}, Al, + N; est 
TPK. 


Preuve : 1) On note u l’endomorphisme associé à À dans la base canonique 
de K?. En appliquant le lemme de décomposition des noyaux à y,,, on a 


K? = Ker(u — A1d)%@...@ Ker(u — Ald)*. 


Les C; = Ker(u — À;1d)% sont les sous-espaces caractéristiques de u, ils sont 
stables par u. On peut donc définir u,c, l’endomorphisme induit par u sur Ci. 
Pour tout x € Ci, (u — À;ld)%(x) = 0 donc ujc, — Xld est nilpotent. Dans 
une base de C;, la matrice de üc, S’écrit donc A;1,, + N; avec N; nilpotente. 
Si B est une base de K? obtenue en recollant des bases des C;, on a 


[u]8 — diag(\ y; + N,..., Àklpy + Nx). 


2) Si À est de plus TPK, pour tout n € N* il existe B € M,(K) telle que 
A = B". On note v l’endomorphisme associé à B dans la base canonique 
de K?. Puisque À est un polynôme en B, v et u commutent, v laisse stable les 
sous-espaces caractéristiques de u. 

La matrice de v dans B (la base adpatée à la décomposition en sous-espaces 
caractéristiques de u) s'écrit donc 


fuls = diag(B1,.…, Br) 


avec B; € Mh,(K). 

On à donc diagonalisé par bloc u et v dans une même base. Voici la traduction 
matricielle. Si P désigne la matrice de passage de la base canonique de KP à B, 
on à 


A = Pdiag(lil + Ni,..., xl + Nx)PT let B = Pdiag(B1,...,Bx)PTŸ. 


Comme A = B”, par produit des blocs, on tire que pour tout à € {1,...,k} 
et pour tout n € N*, 


Les matrices À;1,, + N; sont donc TPK. 
Réciproquement, si les matrices 4;1,, + N; sont TPK, on a pour tout n € N* 


A = Pdiag(B:",..., B;")P"1 = (P diag(B1,.…. BE. 


ce qui prouve que À est TPK. D 


Dans le cas où le polynôme caractéristique est scindé, la décomposition en 
sous-espaces caractéristiques permet donc de "dévisser" le problème. Il suffit 
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de déterminer les matrices toutes puissantes de la forme À, + N avec N 
nilpotente. 

La réduction du théorème 7.2 va nous fournir en plus la décomposition de 
Dunford que nous utiliserons pour démontrer le lemme 7.2. 


Corollaire 7.1 (Décomposition de Dunford) Soit A € M,(K) tel que son 
polynôme caractéristique x À est scindé sur K. Il existe un unique couple (D, N) 


de matrices de M,(K) avec D diagonalisable sur K et N nilpotente tel que 
A=D+N et DN = ND. De plus, D et N sont des polynômes en A. 


Preuve : 1) Reprenons les hypothèses du théorème précédent. On note 
D = Pdiag(Al,,,.…., Axl,)P7Tet N = Pdiag(N,.…., Nx)P71, on à alors 


A=D+N, 


avec D diagonalisable sur K et N nilpotente. De plus, D et N commutent 
puisque les blocs N; commutent avec les blocs d’homothétie X;1,,. 


2) Montrons que D et N sont des polynômes en A. Pour tout +, on note p; 

la projection sur C; parallèlement à 4,0; et D; sa matrice dans la base B. 
Comme D = Ÿ',\;D;, il suffit de montrer que les matrices D; sont des poly- 
nômes en À. 
On pose M; = (X — À)% et Fi = IT,,; M5. Puisque les M; sont premiers 
deux à deux, aucun facteur n’est commun à tous les P;, ils sont donc premiers 
dans leur ensemble. D’après Bezout, il existe donc des polynômes VU; tels que 
D,U;P; = 1. Le polynôme Q; = U;P,; vérifie alors : 


Qi = 1 mod(X — X;)% 
() ViZ£i Qi=0 mod(X — À;)%. 


Qi(u) s’annule donc sur @,4:C; et coïncide avec l'identité sur C;, c’est donc 
la projection sur C; parallèlement à @,4;C;, ce qui donne matriciellement 
D; = Q;(A), et donc D est bien un polynôme en À, donc N = À — D aussi. 


Remarque : le théorème des restes chinois assure directement l’existence 
d’un polynôme Q; vérifiant (+). 


3) Unicité : Si A = D'+ N', alors D — D' = N — N'. Comme ces 4 matrices 
sont des polynômes en À, D commute avec D' et N commute avec N', donc 
D — D’ est diagonalisable (elles sont simultanément diagonalisables car elles 
commutent) et N — N'est nilpotente comme somme de matrices nilpotentes 
qui commutent (cela sera détaillé dans la preuve de la proposition 7.3). 
Comme la seule matrice à la fois nilpotente et diagonalisable est la matrice 
nulle, on en déduit que D — D' = N — N'—0, ce qui prouve l’unicité. 
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7.2.2 L’exponentielle : une bijection entre nilpotents et uni- 
potents 


Une matrice À appartenant à M,(K) est dite unipotente s’il existe une ma- 
trice N € M,(K) nilpotente telle que A = 1, + N. 

On note respectivement Z4,(K) et W,(K) l’ensemble des matrices de M,(K) 
unipotentes et nilpotentes. 

Afin de pouvoir définir l’exponentielle et le logarithme de matrices, on va 
supposer ici que le corps K est de caractéristique nulle (on peut sinon pour 
simplifier les choses supposer que K est un sous-corps de C). 

On restreint la définition de l’exponentielle aux matrices nilpotentes. 

Soit N € N,(K), on pose exp(N) = 5% À (somme de support finie). 


n=0 n! 
Soit U € U,(K), on pose logU — ps Clin ee (somme de support 
finie). 
Le lecteur aura remarqué que si le corps était de caractéristique p, on ne sait 
pas à priori ce que signifie À, et donc on ne sait pas définir l’exponentielle 
d’une matrice nilpotente. 


Proposition 7.3 L'application exponentielle réalise une bijection entre les 
ensembles N,(K) et U,(K). De plus, l'application réciproque est la fonction 
logarithme. 


Preuve : 1) Si N € W,(K), 


exp N — L +- ÿ BE. 
n=1 
N' 


puisque l’indice de nilpotence est inférieur ou égal à p. La matrice exp(N) est 
donc bien à coefficients dans K. 

N'est une somme finie de matrices nilpotentes qui commutent 2 à 2, c’est donc 
une matrice nilpotente. En effet si Ni et N2 sont dans W,(K) et commutent, 
par le binôme de Newton, on a (Ni + N2)#? = ee (P)NENÉP É = 0 car 
pour k > p, NF = 0 et pour k < p, NÈPÈ = (0. 


2) La fonction logarithme est bien définie sur Z,(K) car c’est une somme 
finie. En effet, si À € U,(K), (A — 1,)* = 0 dès que k > p. Ainsi 


log À = Si 
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est nilpotente puisque c’est une somme finie de matrices nilpotentes qui com- 
mutent 2 à 2. 


3) Reste à prouver la bijection. Pour tout x € R, exp(x) = DÈX 2, pour 
L si 1) 
tout réel y tel que [y — 1] < 1, on à In(y) = 5% (-1)" LG, Comme 


exp(In y) = y, on a l’identité suivante entre séries formelles : 
+00 +00 NT 
1 K1®—-1) | - 
Daft) 7. 
n=0 k=1 


Si on prend pour Ÿ une matrice À € U,(K), cela donne exp(log À) = A. On 
raisonne de même pour obtenir log(exp N) = N si N € N,(K). D 


Corollaire 7.2 Les matrices unipotentes de M,(K) sont des exponentielles et 
sont toutes puissantes sur K. 


Preuve : Si À € M,(K) est unipotente, d’après la proposition précédente, 
il existe N' € M,(K) nilpotente telle que À = exp(N). 
Pour tout n € N*, À = [exp(N'/n)}" (car N'/n commute avec elle-même), 
avec B = exp(N'/n) qui est bien à coefficients dans K puisque N//n est une 
matrice nilpotente à coefficients dans K. 


Proposition 7.4 La seule matrice nilpotente toute puissante sur K est la 
matrice nulle. 


Preuve : Si N € M,(K) est TPK, en particulier il existe une matrice R 
telle N — RP. R est alors nilpotente et donc RP — 0 ce qui donne N — 0, qui 
est bien sûr toute puissante puisque pour tout n € N*, O0 = 0”. 


7.2.3 Le cas non inversible se ramène au cas inversible 


Dans ce paragraphe, on montre que pour déterminer les matrices TPK, il 
suffit de s'intéresser aux matrices inversibles. La proposition suivante précise 
le propos. 


Proposition 7.5 Une matrice À non inversible est TPK si et seulement si il 
existe une matrice M inversible et TPK telle que À soit semblable sur K à la 
matrice par blocs diag(0, M). 


Preuve : 1) Soit À non inversible TPK. On note u et v les endomorphismes 
respectivement associés à À et B dans la base canonique de K?. Le noyau de u 
n'est pas réduit à 0. Ainsi x, = X”Q(X) où X” et Q sont premiers entre eux 
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et r est non nul. 
Le lemme de décomposition des noyaux donne KP = Keru” & Ker Q(u). 
Puisque u et v commutent, v laisse stable Ker u” et Ker Q(u). En choisissant 
une base B de K? adaptée à la somme directe ci-dessus, et en notant P la 
matrice de passage de la base canonique à B, on a comme dans la preuve 
de 7.2 
A = Pdiag(A1, A)P 7! et B = Pdiag(B1, B2)P° À, 

avec en plus A1 nilpotente et A2 inversible. 
Pour tout n € N* À; = B} donc les matrices À; sont TPK. 
À, est nilpotente et TPK, elle est donc nulle d’après 7.4. 
On conclut en posant M = 42. 

2) Réciproquement, supposons que À = P diag(0, M)P"! avec M inversible 
et TPK. Déjà À est non inversible. Si pour tout n € N* il existe B telle que 
M = B7, on a 


A = Pdiag(0, B")P7! = (Pdiag(0, B)P !}", 


ce qui prouve que À est bien TPK. 


7.3  Matrices toutes puissantes sur C 


D’après la proposition 7.5, il suffit de déterminer toutes les matrices inversibles 
toutes puissantes. Nous allons voir que, comme dans le cas de la dimension 1, 
la situation est assez simple : nous allons démontrer que toute matrice de 
GL,(C) est une exponentielle et est donc TPC. 


Proposition 7.6 L'application exponentielle est une surjection de M,(C) sur 


GL,(C). 


Preuve : - Montrons déjà qu’une exponentielle est inversible. Toute matrice 
M € M,(C) est triangularisable donc semblable à une matrice triangulaire 
dont la diagonale est constituée des valeurs propres de M. La matrice exp M 
est donc semblable à une matrice triangulaire dont la diagonale est constituée 
des exponentielles des valeurs propres de M. En passant au déterminant, on 
a donc 

det(exp M) = exp(Tr M), 


ce qui prouve que exp(M) est inversible. 


- Si À € GL,(C), 0 n’est pas valeur propre et d’après le théorème 7.2 (x4 
est scindé sur C), 


A Paso ENises Ages Ne)PTE 
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Comme À; # 0, il existe r; € C tel que À; = ei (exp : € — C* est surjective). 
De plus il existe une matrice N’ telle que 14, + Ÿ — exp N! puisqu'elle est 
unipotente. On à alors 


N; 
—) = ei exp(N}) = exp(r;la, + N°) 


Mas + Ni = Moi + 


car rila, et N! commutent. Ainsi, 


A = exp (Pdiag(rilas + Ni,...,rklax + NP). 0 


Remarque : L’exponentielle n’est pas bijective puisque ce n’est pas vrai en 
dimension 1. 


La proposition précédente nous permet de déterminer toutes les matrices TPC. 


Théorème 7.2 (Description des matrices TPC) Les matrices toutes puis- 
santes sur € sont les matrices A telles que dimKer À = ao où @o est la 
multiplicité de 0 dans le polynôme caractéristique de A. En particulier, toute 
matrice inversible est toute puissante sur C. 


Preuve : - La proposition précédente implique directement que toute ma- 
trice inversible est TPC. Dans ce cas dim Ker u = 0, qui est la multiplicité de 
la valeur propre 0 puisque 0 n’est pas valeur propre. 


- Si À est une matrice non inversible et TPC, d’après la proposition 7.5 et 
la proposition précédente, À est semblable à diag(0, M) avec M inversible. On 
note s la taille du bloc nul. Il est clair que la multiplicité de la valeur propre 0 
dans x, est s et que dim Ker À = s. U 


Exemples : 
0 à 7 

1. La matrice À = {0 0 3} n’est pas TPC puisque 0 est valeur propre 
0 0 5 


de multiplicité 2 mais que rangA = 2 et donc dim Ker À = 1 # 2. 


2. La matrice 


0 0 0 0 
1 0 O0 —-1 
Fée 0 1 0 —3 
0 0 1 —3 


est la matrice compagnon associée au polynôme 


PIX)=X+3X°+3X2 +1 X = X(X +1). 
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On a donc Yy = X(X +1)°. 0 est donc valeur propre de multiplicité 1. Comme 
rangM = 3, dim Ker M = 1 qui est la multiplicité de 0. M est donc TPC. 

M est à coefficients réels, on peut donc naturellement se demander si elle est 
TPR. Comme y, est scindé sur R, la décomposition en sous-espaces carac- 
téristiques donne que M est semblable à diag(0, —173 + N) avec N € MR) 
nilpotente. D’après la propriété 7.2 de dévissage, si M est TPR, alors —13 + N 
est aussi TPR. Mais det(—JZ3 + N) = (—1) = —1 < 0, donc —13 + N n'est 
pas un carré et donc n’est pas TPR. La matrice M est donc TPC mais n’est 
pas TPR. 


7.4 Matrices toutes puissantes sur R 


7.4.1 Premières constatations 


Puisque toute exponentielle de matrice réelle est TPR, il est naturel de déter- 
miner l’image exp (M,(R)). On a vu à la section 7.3 que pour tout M € M,(C), 


det(exp M) = exp(Tr M). 


Cette égalité est donc en particulier vraie si M € M,(R), ce qui donne 
det(exp M) > 0. Ainsi exp(M,(R)) C GLY(R). Cette inclusion n’est pas une 


égalité. En effet, 
—3 0 
Fe) 


n’est pas un carré, donc pas une exponentielle, pourtant det M > 0. En effet, 
si R? — A, alors R commute avec À diagonale à spectre simple, donc R est 
aussi diagonale et s'écrit R = diag(r1,r2) avec r? = —3, ce qui est impossible. 
Attention, il existe des matrices qui sont des exponentielles qui ont pourtant 


leurs valeurs propres négatives. Penser à 


la matrice de rotation d’angle 7. Elle est le carré de la matrice de rotation 
0 —1 

1 0 

Plus généralement, il est facile de voir que M est TPR. En effet, pour tout 
n € N*, 


d'angle 7/2, M — 


= (or en 


sinT/n  CcosT/n 
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Ce résultat est naturel, si on itère n fois une rotation d’angle æ/n, on obtient 
une rotation d’angle x. Par ailleurs, on peut montrer que pour tout réel 6, 


O —0\ fcosû —sin0 
XP T9 0) \sin0 cos J' 


- , ; 0 — 
ce qui montre que M est aussi une exponentielle, M — exp È 4 


7.4.2 Image de l’exponentielle de matrices réelles 


En dimension 1, un nombre réel est une exponentielle si, et seulement si, 
c’est un carré non nul. Nous allons voir que cela se généralise en dimension 
supérieure, c’est l’objet du théorème suivant. 


Théorème 7.3 (Image de l’exponentielle de matrice réelle) 
exp(M,(R)) = {R?, RE GL,(R)}. 


Autrement dit, une matrice réelle inversible est une exponentielle si, et seule- 
ment si, c’est un carré. Ce résultat est assez remarquable : pour savoir si une 
matrice inversible réelle est une exponentielle, il suffit de tester si c’est un 
carré, ce qui est généralement plus simple. 

La preuve que nous allons donner est tirée d’un article de Michel Coste [www], 
enseignant à la prépa-agreg de Rennes. Nous aurons auparavant besoin de 
démontrer un lemme qui raffine la surjectivité de exp : M,(C) — GL,(C). 


Lemme 7.2 (Raffinement de la surjectivité de l’exponentielle com- 
plexe) Pour toute matrice M de GL,(C), il existe un polynôme P € C [X1 tel 
que M = exp(P(M)). 


Preuve : - Soit M € GL,(C). On écrit sa décomposition de Dunford (x 

est scindé sur C) : M = D + N avec D diagonalisable sur €, N nilpotente, 
et D et N qui commutent. On utilisera en plus que D et N sont des polynômes 
en M, c’est un ingrédient essentiel. 
Puisque D est inversible, M = D(I, + DIN). L'idée est de trouver deux 
polynômes U et V tels que D = exp(U(M)) et 1, + DIN = exp(V(M)). 
Puisque U(M) et V(M) commutent, on aura alors M = exp{U(M) + V(M)) 
ce qui démontrera le lemme avec P = U +V. 


- On écrit D = Pdiag(l,...,19)P 1 où les À; sont les valeurs propres 
toutes non nulles puisque M est inversible. 
Pour tout À € Spec(M\), il existe un nombre complexe 1, tel que exp = À 
puisque exp : € — C* est surjective. Il existe alors un polynôme interpolateur 
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de Lagrange L tel que pour tout u € Spec(M), L(À) = u, puisque les À sont 
disctincts deux à deux. Alors 


D = Paris AP 

— Pdiag(exp,...,exp He 

= SH (Pdéelhies, HP) 

= exp(Pdiag(L(),...,L(x))P 1) 
exp ((L(P diag(M,...,À9)P71) 
= exp(L(D)). 


Comme D est un polynôme en M, L(D) est aussi un polynôme en M, ce qui 
donne l’existence du polynôme U. 


- Montrons que 1,+ DIN est unipotente. La matrice D! est un polynôme 
en D. En effet, d’après le théorème de Cayley-Hamilton, Yp(D) = 0, ce qui 
donne 

(—1)PDP + ap-1DP +. + a1D + aol = 0 


avec ap = det D # 0. En composant par D! puis en divisant par ao, on a 
donc 
DT = a07" ((—-1)DP TT + ap 1 D? +... +), 


ce qui donne le résultat. La matrice N commute avec D donc avec D! puisque 
c’est un polynôme en D. 

On a alors (DIN) = (D-T)PNP = 0 ce qui prouve que DIN est nilpotente 
et donc que 1, + DN est unipotente. D’après la proposition 7.3, elle est 
l’exponentielle d’un logarithme, plus précisément, 


EE 


1,+ DIN = exp 5 on) 


k=1 


Ce logarithme est une somme finie, c’est un polynôme en DIN, donc un 
polynôme en M car D-let N le sont aussi. Z,+ DEN est donc un polynôme 
en M, ce qui donne l’existence du polynôme V et achève la preuve du lemme. 


Preuve du Théorème 7.3 : 


- Si M = exp(T), avec T réelle, M est inversible et M = (exp(T/2))°? donc 
est un carré. 


- Passons à la réciproque. On suppose que M = R? avec R € GL,(R). 
On applique le lemme 7.2 à R, il existe un polynôme complexe P tel que 
R = exp(P(R)). Puisque R est réelle, en passant au conjugué, on a aussi 
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R = exp(P(R)). P(R) et P(R) commutent, donc À? = exp(P(R) + P(R)), ce 
qui montre que M = R? est l’exponentielle de la matrice réelle P(R) + P(R). 


Remarque : Contrairement à la dimension 1, exp n’est pas injective 
sur M,(R) pour p £ 1. Par exemple pour p = 2, trouvons une matrice réelle 
qui à pour valeurs propres 2ir et —2ir. Le polynôme caractéristique vaut alors 
X? + 4r?, il n’y a qu’à prendre sa matrice compagnon 


0 —4r°? 
A= Ë : ) | 
À est diagonalisable sur C, semblable à diag(2ir, —2ir) donc son exponentielle 
est semblable à diag(exp(2ir),exp(—2ir)) = 12. On a donc 


exp(4) = exp(0) = 12, 


ce qui montre qu’il n’y à pas injectivité. 


7.4.3 Caractérisation des matrices TPR 


Compte tenu de la proposition 7.5, nous avons donc directement le résultat 
suivant : 


Théorème 7.4 (Caractérisation des matrices TPR) 
Les matrices TPR sont : 
- les matrices de la forme B? avec B réelle inversible, 
- les matrices semblables sur R à diag(0, M?) avec M réelle inversible. 


Exemples : détermination des matrices TPR de M2(R) 
Soit À € M(R). 
1. Supposons que Y, est scindé sur R. 


a. Si les valeurs propres sont distinctes, alors À est diagonalisable sur R, 
et admet une racine carrée si, et seulement si, ses deux valeurs propres sont 
—3 O0 
ee. 
quand même voir par exemple le sujet d’algèbre MP des CCP de 2005). 


positives ou nulles (Pidée est la même que pour À = on peut 


b. Si la valeur propre est double, À est semblable à À + N avec N 
nilpotente. 


- Si À = 0, À est nilpotente. Elle est donc TPR si, et seulement si, 
A=0. 
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- Si À > 0, A/X est unipotente donc TPR et donc un carré R?. Mais 
alors À = (VXR), donc À est TPR. 


- Si À <0, À = —N avec X > 0. Alors A/N est semblable soit à —1, 


—1 1 
. K DE 
sit à 4° = ( i): 


On à déja vu que —/2 est un carré (le carré de la rotation d’angle 7/2). 
Supposons que 4 — PR? avec R réelle, alors en trigonalisant simultanément 4’ 
et R, on voit que les valeurs propres de 4’ sont les carrés de celles de R, 
donc celles-ci valent à ou —i. Comme R est réelle, ses valeurs propres sont 
conjuguées donc À admet 2 valeurs propres distinctes, donc est diagonalisable 
sur C, donc À’ aussi, ce qui n’est pas. 4’ n’est donc pas un carré. 


2. Supposons que YX4 ne soit pas scindé sur R. Alors c’est un polynôme 
irréductible sur R, donc À est semblable sur R à une matrice du type 


a —b 
S — 
6) 
avec b Z 0. Si on pose z = a + ib = re, S représente dans la base canonique 


la matrice de la similitude directe de rapport r et d’angle 0 : 


S—rkRg avec Ro — sn ue ) : 


sin  cosô 


S est donc le carré par exemple de la matrice \/rRp,2. 


7.A.A Caractérisation des carrés inversibles 


Le théorème 7.4 ne peut être satisfaisant, que si l’on sait reconnaître les ma- 
trices réelles inversibles qui sont des carrés. Le théorème suivant énoncé par 
Rached Mneimné dans [Mn] p. 90 apporte une réponse relativement simple à 
notre problème. 


Théorème 7.1 Une matrice réelle inversible est un carré si, et seulement si, 
pour chaque (éventuelle) valeur propre négative, les blocs de Jordan associés 
de même taille sont en nombre pair. 


En particulier, nous obtenons : 


Théorème 7.2 Une matrice réelle qui n’a pas de valeur propre négative est TPR. 
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Exemples : 1. La matrice 


0 0 0 —-I 
1 0 0 0 
À 0 1 0 —2 
0 0 1 0 


est TPR puisque x4 = X4+2X? +1 = (X2 +1). 


2. Déterminons les matrices TPR de la forme À = —/4+4+N avec N € MAR) 
nilpotente. On considère les blocs de Jordan 


| 


Lodel TP em sert 
ne 
N 


Les résultats sur la réduction de Jordan disent que À est semblable à l’une des 
matrices suivantes : A = diag(—1,—1,—1,—1), A2 = diag(—1,—1,J2(—1)), 
A3 = diag(—1,J3(—1)), 44 = diag(J2(—1)), J2(—1)) ou A5 = J4(—1). 

Parmi ces matrices, les seules qui sont TPR sont A1 = diag(—1,—1,—1,—1) 
et A4 = diag(J2(—1)), J2(—1)). 


7.5 Matrices toutes puissantes sur un corps fini 


Dans cette section K désigne le corps F,. Remarquons que le groupe GL, (F3) 
est fini, notons N son cardinal. Soit M une matrice inversible toute puissante 
sur F,, il existe une matrice B de GL,(F,) telle que M = B\. Mais par le 
théorème de Lagrange, BN — 1, ce qui donne M — I,. Grâce à la proposition 
7.5, on vient donc de prouver qu’une matrice toute puissante est semblable à 
une matrice diagonale avec uniquement 0 et 1 sur la diagonale, c’est-à-dire la 
matrice d’un projecteur. Réciproquement, une telle matrice M est bien toute 
puissante car pour tout n € N*, M = M". On a donc prouvé : 


Théorème 7.5 Les matrices toutes puissantes sur un corps fini sont les ma- 
trices des projecteurs. 


7.6 Matrices toutes puissantes sur Q 


7.6.1 Cas des matrices de la forme rl, + N 


Nous allons chercher quelles sont les matrices TPQ de la forme r1, + N avec 
rEeQet N € N,(Q). Supposons que la matrice À = r1, + N soit TPQ. Alors 
son déterminant qui vaut r? est égal à 0 ou 1 car TPQ. 
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e Sir? = 0 alors r —=0et À = N est nilpotente et TPQ donc À = 0 d’après 
la proposition 7.4. 
e Si r? — 1 comme r € Q, on a r — 1 ou —1 et dans ce cas p est pair. 
- La condition r = 1 signifie que À est unipotente. Réciproquement, 
d’après le corollaire 7.2 une matrice unipotente est bien TPQ. 
- Reste à traiter le cas r = —1. Nous allons démontrer qu’une matrice du 
type —1,+N n’est pas TPQ. Pour cela nous aurons besoin du lemme suivant. 


Lemme 7.3 Pour tout entier naturel k, le polynôme X2° +1 est irréductible 


sur Q. 
Preuve : « Première démonstration : On pose P(X) = X?° +1. L'idée 
est d'appliquer le critère d’Eisenstein ([Pe] p 76) au polynôme P(X + 1). 


- Montrons par récurrence sur k que tous les coefficients de (X + 1)? mis 
à part le premier et le dernier sont pairs. C’est vrai pour Æ — 1 puisque 
(X +1)? = X?2+2X +1. Supposons que c’est vrai au rang k. 


2 


2 2k 
(XH)T = ((x+D = [Sax] =S xs V7  bb;xit. 
i=0 i=0 i,j€{0,...,2À} 
i<ÿ 


Par hypothèse de récurrence, pour à € {1,...,2*—1}, b; est pair. Si l’on regarde 
modulo 2, on a donc 


ok 
(X +1) = SN Rx = x +1 
i—0 


ce qui prouve l’hérédité. 

- Le polynôme P(X +1) = (X + 1) + 1 à donc comme terme de plus haut 
degré X 2° son coefficient constant vaut 2 et tous les autres coefficients sont 
pairs. Il vérifie donc le critère d’Eisenstein avec p = 2 et est donc irréductible 
sur Q. 

- Si P(X) est réductible sur Q, P(X) = U(X)V(X) avec U et V polynômes à 
coefficients dans Q de degrés non nuls. Mais alors P(X +1) = U(X+1)V(X+1) 
avec U(X +1) et V(X +1) de degrés non nuls et à coefficients dans Q, ce qui 
est impossible puisque P(X + 1) est irréductible sur Q. P(X) = X 2 +1 est 
donc bien irréductible sur Q. [ 


e Deuxième démonstration : Montrons que X 2° + 1 est en fait Por+i 
le polynôme cyclotomique d'ordre 2*+1, comme les polynômes cyclotomiques 
sont irréductibles sur Q ([Pe] p 82), cela démontrera le lemme. 
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On rappelle que Dox+1 = [[(X — 6) où Ç parcourt l’ensemble des racines 
primitives 2*+l_jèmes de l’unité. Le polynôme Dx+1 est donc unitaire, et son 
degré vaut 4(2*+1) = 2k#1 2 246 = 9k Gù 6 est la fonction indicatrice d’Euler. 
Soit 6 une racine primitive 2**l-jèmes de l’unité. On a 


2k\2 DR 
CR SR 
donc 6? est une racine primitive 2-ième de l’unité, donc €? — —1, ce qui 
Ke x k see k à 
entraîne que Ç est racine de X? +1. hors divise donc X? + 1 mais comme 
ils sont unitaires et de même degré, ils sont égaux. 


Proposition 7.7 Il n'existe aucune matrice TPQ de la forme —1I, + N avec 


N e N,(Q). 


Preuve : Soit k un entier tel que 2° > p. Supposons que À = —1, + N 
est TPQ, il existe en particulier R € M,(Q) (une racine 2*-ième) telle que 
A = R?°. Puisque N est nilpotente, on a (A + 1,)? = O et (R?° + 1,)P = 
Le polynôme minimal de À noté Tr divise donc (X 2 + 1). Mais X 2 +7 
est irréductible sur Q donc TR est une puissance de X 2h 1, mais comme 
deg Tr < p, nécessairement Tr = 1 ce qui est impossible puisqu’un polynôme 
minimal est toujours de degré supérieur ou égal à 1. 


Remarque : La preuve de cette proposition est instructive car la même 
tactique nous permettra de prouver le théorème plus général 7.8. 


Compte tenu des résultats obtenus à la section 7.2.1, nous avons démontré le 
théorème suivant : 


Théorème 7.6 Soit À une matrice TPQ telle que son polynôme caractéris- 
tique est scindé sur Q. 

a) Si À est inversible, À est unipotente. 

b) Sinon À est semblable sur Q à la matrice par bloc diag(1, + N,0) où N 
est une matrice rationnelle nilpotente et r le rang de la matrice. 


7.6.2 Une première étude du spectre d’une matrice TPQ 


L'objectif de cette partie est de montrer que les valeurs propres complexes 
d’une matrice TPQ sont nécessairement rationnelles, ce qui prouvera que son 
polynôme caractéristique est scindé sur Q. 

Une importante avancée nous est permise grâce au théorème suivant dont on 
trouvera une preuve de Daniel Perrin (je l’en remercie vivement) en annexe 
dans la section 7.6.4. 
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Théorème 7.7 (Perrin) Soit K une extension de Q de degré finie. Les seuls 
nombres TPK sont 0 et 1. 


La preuve utilise de la théorie algébrique des nombres, elle utilise notamment 
deux résultats difficiles : 


- les idéaux fractionnaires d’un anneau des entiers admettent une décompo- 
sition unique en produit d’idéaux premiers. 

- le théorème des unités de Dirichlet qui précise la structure du groupe 
abélien des unités d’un corps de nombres. 


Cette preuve est toutefois très instructive et culturelle, elle permet d'illustrer 
le fait qu’un idéal généralise la notion de nombre et qu’on peut y définir des 
opérations. 


Conséquences : Le polynôme caractéristique x, est scindé sur son corps 
de décomposition noté K. On peut donc diagonaliser À en blocs TPK de la 
forme AJ, + N. Si À est une valeur propre de À, et que k est la taille du bloc 
associé y + N, on obtient en passant au déterminant que À est TPK, donc 
vaut 0 ou 1 grâce au dernier théorème; ce qui donne que À vaut 0 ou bien est 
une racine de l’unité. 

Si les valeurs propres sont simples, £ = 1, et dans ce cas on conclut directement 
que À vaut 0 ou 1. Nous venons donc d'obtenir : 


Proposition 7.8 Les valeurs propres d’une matrice TPQ sont parmi 0,1 ou 
les racines de l’unité. 


Nous allons maintenant prouver que parmi les racines de l’unité, 1 est la seule 
valeur propre possible pour une matrice TPQ. 


7.6.3 Etude finale du spectre et conclusion 
A. Une famille de polynômes irréductibles 
Nous allons prouver la proposition suivante (je remercie à ce sujet Clément de 


Seguin Pazis qui à permis de simplifier la preuve) : 


Proposition 7.9 Soit une racine primitive n-ième de l’unité (n > 2). Pour 
tout entier a > 1, le polynôme X"° — Ç est irréductible sur Q((). 


Preuve : On rappelle que si Ç est une racine primitive n-ième de l’unité, 
Q(C) est un Q-espace vectoriel de dimension w(n) où y est l’indicatrice d’Euler 
([Pe] p. 83). 
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1. Soit z une racine de P, = X"° — (. En élevant à la puissance n, on 
voit que z est une racine n°+tl-ième de l’unité. Montrons qu’elle est en plus 
primitive. On sait déjà que l’ordre de z divise n°+1. 

Si r est un entier, on sait que l’ordre de z” est égal à l’ordre de z divisé par 
pgcd(r,ordre(z)). Si l’on note k l’ordre de z, l'égalité 2°” = Ç entraîne que les 
ordres de ces deux éléments sont égaux, et donc que 


— = TN 
pecd(nt,k) 


soit k = npgcd(n”,k). D’après Bezout, il existe des entiers uw et v tels que 
k = unttl +unk (x). 

Supposons k < n°*1, alors n*1/k = q > 2, et en divisant (x) par #, on obtient 
1 = uq + vn, donc pgcd(q,n) = 1, ce qui est impossible car q | n°! et donc 
admet un diviseur premier qui divise n. 

Les racines de P, sont donc des racines primitives n“°°-ièmes de 1, le corps 
de décomposition de P, sur Q(C) est donc le corps cyclotomique Q(2) avec z 
racine primitive n°+l-ième de 1 dont la puissance n‘-ième vaut . 


+1 


2. L'extension cyclotomique Q(2) est de degré g(n®*1) au dessus de Q, ie 
[Q(2) : Q] = p(n*1) = nty(n). En effet, pour tout nombre premier p, 


2) a+ 


pp) = pl 2 pt = pé(p — 1) = ppp), 


ce qui donne le résultat puisque & est multiplicative. 


3. La propriété de multiplicativité des degrés des extensions ([Pe], Corollaire 
1.5 p. 65), donne 


Comme [Q(C) : Q] = y(n), on obtient [Q(z) : Q(6)] = n°. Le polynôme 
minimal de z sur Q(C) est donc de degré n°. Or P, est un polynôme annulateur 
de z, unitaire et de degré n°, c’est donc le polynôme minimal de z sur Q(C), 
et à ce titre, il est irréductible sur Q((). 


Remarque : Le cas n = 2 redonne le résultat déja démontré au lemme 7.8. 


B. Étude finale du spectre et conclusion 


Lemme 7.4 Soit P un polynôme à coefficients rationnels irréductible sur Q. 
Si les racines complexes de P sont des racines de l’unité, alors P est un poly- 
nôme cyclotomique (à un inversible près). 
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Preuve : Soit Ç une racine de P. C’est une racine n-ième de l’unité, donc une 
racine primitive mais pas forcément n-ième. Quitte à diviser par le coefficient 
du terme de plus haut degré, on peut supposer P unitaire. Il est de plus 
irréductible, c’est donc le polynôme minimal de € et coïncide donc avec un 
polynôme cyclotomique ([Pe|, corrolaire 4.11 p. 83). 


Maintenant, tout est prêt pour la conclusion finale. 


Théorème 7.8 (Spectre d’une matrice toute puissante) 
Les valeurs propres d’une matrice TPQ sont 0 ou 1. 


Preuve : Soit À une matrice TPQ. On suppose qu’elle admet pour valeur 
propre une racine de l’unité Ç distincte de 1. On écrit alors x4 = PF x Q avec 
P irréductible sur Q ayant Ç pour racine et P premier avec Q. En utilisant 
une base adaptée à cette décomposition via le lemme des noyaux, on obtient 
que À est semblable à une diagonale de 2 blocs qui sont eux même TPQ (on 
procède exactement comme dans la preuve de la proposition 7.2). Notons 4’ 
le premier bloc. Son polynôme caractéristique est justement PF. 

D’après la proposition 7.8, ses racines sont des racines de l’unité, donc d’après 
le lemme 7.4, P est un polynôme cyclotomique, et toutes ses racines sont dans 
Q(C). 

Ainsi x4 est scindé sur Q(C), par dévissage (proposition 7.2), il existe une 
matrice nilpotente N telle que le bloc (14 + N soit tout puissant sur Q(C). 
Pour tout n € N*, il existe une matrice B à coefficients dans Q(C) telle que 
B? = CI, + N, ce qui donne (B° — C1,)* = 0 puisque N est nilpotente. 

Le polynôme minimal de B, noté rp, divise donc (X7 — C}f. 

Notons t l’ordre de, i.e. Ç est une racine primitive t-ième de l’unité. Prenons n 
égal à {® de sorte que t* soit strictement supérieur à k la taille de la matrice B 
(et donc au degré de tg). La proposition 7.9 nous dit que X*° — € est irréduc- 
tible sur Q(C), comme deg rg < deg(X"” — C), nécessairement, Tg = 1, ce qui 
est impossible. [ 


Ce théorème nous montre qu’une matrice TPQ a son polynôme caractéristique 
scindé sur Q, on est donc toujours dans le cas du théorème 7.6. On a donc 
terminé, et démontré que les matrices toutes puissantes sur Q sont : 


- les matrices unipotentes (cas inversible). 


- les matrices semblables sur Q à une matrice bloc du type diag(J, + N,0) 
où N est une matrice rationnelle nilpotente et r le rang de la matrice. 


Il est facile de voir que cette condition équivaut à dire qu’une matrice À de 
M,(Q) est TPQ si, et seulement si, A(A — 1,)P = 0. On peut donc énoncer : 


7.6. MATRICES TOUTES PUISSANTES SUR Q 279 


Théorème 7.9 (Description des matrices TPQ) Une matrice À de 
M,(Q) est toute puissante sur Q si, et seulement si, A(A — I,)P = 


7.6.4 Annexe : nombres tout puissants sur un corps de nombre 


Nous allons donc démontrer le théorème 7.7 de Perrin. 

K désigne une extension finie de Q. On note À l’anneau des entiers de K, 
c’est-à-dire les éléments de K racines d’un polynôme à coefficients entiers et 
on note À* le groupe de ses éléments inversibles (les unités). On sait que À 
est un anneau de Dedekind ([S], Ch. III, 8. 4, Th. 1). L'idée est de copier la 
preuve utilisée pour Q (théorème 7.1), en remplaçant la décomposition unique 
en produit de nombres premiers par la décomposition en produit d’idéaux 
premiers. On commence par montrer le lemme suivant. 


Lemme 7.5 Soit a € K, a £ 0 un nombre tout puissant sur K. Alors a est 
dans À*, de plus ses racines n-ièmes sont aussi dans A*. 


Preuve : Pour tout n € N°, il existe b € K tel que a = b”. On considère les 
idéaux fractionnaires non nuls (a) et (b). Par exemple, 


(a) = {ax| x € A}. 


Ils admettent des décompositions uniques en produits d’idéaux premiers ([S], 
Ch. I, 84, Th. 3) : 


(a) = II Pr) et (b) = II p%() 


PEP PEP 


où P est l’ensemble des idéaux premiers non nuls de À, et où les v,(a) sont 
des entiers relatifs presque tous nuls. 

On à a = b", donc (a) = (b)"”, l’unicité de la décomposition montre qu’on à 
pour tout P, vp(a) = nup(b). Cela montre que vp(a) est divisible par n et ce 
pour tout n, donc vp(a) = 0 pour tout P, donc (a) = (1) et donc que a € A*. 
On obtient en plus que (b) = 1 et donc b € A*. Les racines n-ièmes de a sont 
donc aussi des unités. Cela sera utile pour la suite. 


Remarque : Si N est une norme sur K ([S], Ch. IT, 8. 6), et que a est tout 
puissant, on à N(a) = N(b)" (la norme est multiplicative), et comme N est à 
valeurs dans Q, cela implique que N(a) = 1 d’après le théorème 7.1. 
Mais cela ne suffit pas à assurer que a est dans AÀ*, penser à € — BEA dans 
Q(i). On a N(a + ib) = a? + b? donc N(c) = 1, pourtant c n’est pas entier 
sur Q(i) puisque les entiers de Q(i) sont les éléments de Z fi] ([S], Ch. IT, &. 5, 
Th.1). 
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Pour finir, il reste le cas des unités. Dans Q il n’y avait que 1 et —1, ici les 
choses sont plus ardues : 


Lemme 7.6 Le seul élément de A* qui est tout puissant sur K est 1. 


Preuve : Le théorème des unités de Dirichlet ([S], Ch. IV, 8. 4, Th.1) 
précise la structure de A*. C’est un groupe multiplicatif abélien de type fini, 
précisément isomorphe à un groupe additif de la forme ZF x G où G est un 
groupe fini cyclique. Soit a dans ce groupe, on l'écrit additivement : 


a — (a, nn) 


avec a; € Z et g € G = Z/rZ. Si a est tout puissant sur K, d’après le lemme 
précédent, il est aussi tout puissant sur À*, ce qui se traduit en termes additifs 
par a = nb. On voit que ceci n’est possible que si les a; et g sont tous nuls 
(pour g on prend n = r). On a donc a = 0 (au sens additif) donc a = 1 (au 
sens multiplicatif). 


7.7 Exercices corrigés 


7.7.1  Diagonalisation de l’exponentielle d’une matrice 


Exercice 7.1 
1. Soit AE M,(C). Donner la décomposition de Dunford de exp À. 


2. Montrer que exp À est diagonalisable si et seulement si À est diagonali- 
sable. 


3. Montrer que exp À = 1, si et seulement si À est diagonalisable et 
spec À C 2irZ. 


4. Juste pour rire sur la fin : donner la décomposition de Dunford de 


u=( ce 


Commentaires : Cet exercice permet de manipuler la décomposition de Dun- 
ford, il précise en plus le défaut d’injectivité de l’exponentielle. 


Corrigé : 1. Soit À = D + N la décomposition de Dunford de A. Comme D 
et N commutent, on a 


exp À = exp D exp N = exp(D) (1, + N') = exp D + exp(D) N' 


avec N° N 1 
2 

NN 

Top Ge 
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Remarquons déjà puisque D et N sont des polynômes en À, que N étant un 
polynôme en N est aussi un polynôme en À et que exp(D) étant un polynôme 
en D est aussi un polynôme en À. 

La matrice exp D est diagonalisable car D l’est (si D = Pdiag(d,...,dn)P71 
alors exp(D) = Pexp(diag(d1,...,dn))P =! = P diag(exp(d1),...,exp(dn))P 1. 
La matrice N' est nilpotente comme somme finie de matrices nilpotentes qui 
commutent. De plus, N’ commute avec exp D car ce sont des polynômes 
en À, donc exp(D)N' est nilpotente (en effet (exp(D)N')" = exp(D)"N" = 0 
puisque N = O). 

Enfin, les matrices exp D et exp(D)N’ commutent aussi car polynômes en À, 
donc par unicité de la décomposition de Dunford, on conclut : 


La décomposition de Dunford de exp À est exp À = exp D+exp(D)N' 
avec N'—expN — I,. 


2. Si la matrice À est diagonalisable, on à déjà vu que exp À l’est aussi. 
Supposons que exp À est diagonalisable. Alors sa partie nilpotente exp(D)N' 
est nulle, donc N’ = exp N — I, = 0, puisque exp D est inversible. 

On peut alors conclure directement que N = 0 grâce à la bijection nilpotent 
unipotent (proposition 7.3) et donc que À est bien diagonalisable. 

Sinon, on peut le faire à la main... Si N est non nulle d’indice de nilpotence r 
(avec 2 < r <n), alors 


IN? N'-1 
N' —= N — — 0 
DA HAS et 
donc X” le polynôme minimal de N, divise X + L ++ Er ce qui est 
impossible pour des raisons de degrés. 
3. Le deuxième sens est facile, À est semblable à diag(a,...,a) avec les a; 
dans 2irZ. La matrice exp À est donc semblable à diag(e%1,...,e%) = 1, 


donc exp À = 1,. 

Supposons que exp À = 1,. Alors, d’après la question précédente, À est diago- 
nalisable, donc semblable à diag(a1,...,an). Dans ce cas exp À est semblable 
à diag(e®,...,e%") = J,. Ceci implique que pour tout à € {1,...,n}, ef = 
donc a; € 2irZ. 


, : jrs 21e la 0 0 3 
4. C’est facile. On écrit M = ( 0 à + È à 
ns ——”  / 
D N 
Les matrices D et N sont respectivement diagonalisable et nilpotente. La 


décomposition de Dunford est le couple (D, N) à condition que D et N com- 
mutent ce qui est... faux! En fait M a ses deux valeurs propres distinctes et 
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à ce titre elle est diagonalisable. Et puisque la matrice nulle est nilpotente et 
commute avec M, la décomposition de Dunford est en fait M = M +0. 


7.7.2 Racines carrées de matrices 


Exercice 7.2 Soit À une matrice de M,y(R). On dit qu’une matrice R de 
M,(R) est une racine carrée de À si À = R?. On note Rac À l’ensemble des 
racines carrées de À. Le but de cet exercice est de déterminer Rac À dans di- 
vers cas. On pourra dénombrer Rac À s'il est fini, sinon remarquer qu'il est 
constitué de classes de similitude. 


1. Déterminer Rac À dans le cas où À admet n valeurs propres réelles dis- 


11 —5 5 
tinctes. Traiter l'exemple A = | —-5 3 —3 
5 —3 3 


2. Déterminer Racl,. 
3. Déterminer Rac0. 
4. Déterminer Rac(—1,). 


5. Expliquer comment on peut déterminer Rac À dans le cas où À est dia- 
gonalisable. 


6. Un cas non diagonalisable sur R : déterminer RacA dans le cas où 


a —b 
a=(, .) avec b £ 0. 


7. Étude topologique : on munit M,(R) d’une norme. 
(a) Montrer que Rac À est une partie fermée d'intérieur vide de M,(R). 
(b) Racl, est-elle une partie bornée ? 


(c) Application : montrer que pour n > 2, n'existe aucune norme || || 
surmultiplicative sur GL,(R), c’est-à-dire telle que pour tous À et B dans 
GL,(R), AB] 2 |AÏNIBIL: 


Commentaires : nous avons vu qu’une matrice inversible est TPR si et 
seulement si elle admet une racine carrée. On peut légitimement se demander 
s’il y a plusieurs racines carrées. On se propose de déterminer toutes les 
racines carrées de matrices diagonalisables. On verra qu’il peut y en avoir 
aucune, un nombre fini ou une infinité. Cet exercice est un bon entraînement 
aux diverses techniques de réduction, diagonalisation simultanée, utilisation 
de polynômes annulateurs.… 

L'exercice se termine par une petite étude topologique de Rac À. On y prouve 
une petite application qui nous dit qu’il n’existe pas de norme "surmultiplica- 
tive" sur GL,(R). 
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Corrigé : 1. À est diagonalisable, À = PDP! avec D diagonale. Si R? — À, 
R commute avec À, donc laisse stable les droites propres de À (car À est à 
spectre simple), À est donc aussi diagonalisable dans la base d’espaces propres 
de À, d’où R = PSP! avec S diagonale. 
On a alors $? = D, ce qui donne s? = d;, où (s;) et (d;) sont les coefficients 
diagonaux de S et D. 


S'il existe un d; < 0, alors il n’y a pas de racine carrée. Sinon, s; = +d; pour 
tout 1. 
Réciproquement les matrices P diag(+d1,...,+Vd»)P"! sont bien des ra- 


cines carrées de À. 


Conclusion : 


- si À admet une valeur propre strictement négative, À n’admet pas de 
racines carrées (réelles). 

- si toutes les valeurs propres de À sont strictement positives, À admet 2” 
racines carrées. 

- si 0 est valeur propre de À et que ses autres valeurs propres sont positives, 
alors À admet 2"! racines carrées. 


Dans l’exemple à traiter, on trouve x 4(X) = —X{(X —1)(X — 16) et 4 racines 
carrées possibles : 


0 0 0 
RacA=4P|0 e1 O0 |P 1, e,ee{+1} 
0 O0 4e 
O —1 —2 
AVEC PIE = 4 
1 1 —1 


Remarque : attention, une matrice qui commute avec une matrice diago- 
nalisable n’est pas forcément diagonalisable. En effet, toute matrice commute 
avec l,, pourtant il y a des matrices non diagonalisables. 


2. Si R? = I}, R annule le polynôme X? — 1 scindé à racines simples. R 
est donc diagonalisable, semblable à diag(£1,...,€,) avec les €; valant +1. 
Réciproquement, si P € GL,(R), alors R = Pdiag(e1,...,en)P 1 vérifie bien 
R? = I,. Donc 


Rac (ln) = {Pdiag(e1,...,en)P !, PE GLa(R)}. 


C’est la réunion de n +1 classes de similitude (cela correspond au nombre de 1 
présents sur la diagonale de diag(£1,...,€n)). 
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3. Si R? — 0, R est nilpotente, donc semblable à une diagonale de blocs de 
Jordan J4 où 


he 7 7 em) 
— 
0 


si k € N*, et Ji = (0). Nécessairement la taille des blocs est inférieure ou égale 
à 2, sinon À? Z 0. R est donc semblable à une matrice 


Ry = diag(J5, ::::40,0,...,0). 
k foi 


Pour des raisons de taille, il y a au maximum E(n/2) blocs J2 dans Ry, donc 
0 < k < E(n/2). Réciproquement, toute matrice semblable à Rx vérifie bien 
R2 = 0. 

On remarque que rg R} = k, donc si k Z k', Rx et Ryy ne sont pas conjuguées. 
RacO est donc constitué de E(n/2) + 1 classes de similitude. 


4. Commençons par une remarque : si n = 2, on interprète —/, comme 
la matrice de rotation d’angle +, on se dit alors que les matrices de rotation 
d'angle x/2 vont jouer un rôle. 

e Si R? — —I,, alors (det R}? = (—1)", donc nécessairement n est pair. 

e_R annule le polynôme X? +1 scindé à racines simples sur C. La matrice R 
est donc diagonalisable, semblable sur € à diag(£1i, …,ent) avec les £; dans 
{+1}. Comme R est réelle, ses valeurs propres complexes sont conjuguées. 
Parmi les €;, il y en a donc autant qui prennent la valeur 1 que la valeur —1. 
Quitte à conjuguer par une matrice de permutation, on a donc 


R = diag(i, —i,.….,4, —i). 


e Maintenant 
O0 —1 RU 
Ryr2 = ( o )  diag(t, —4). 


puisque R,,2 a pour polynôme caractéristique X 24+1—=(X —i)(X +). Par 
produit de blocs, et par transitivité de la relation de similitude, on en déduit 
que R + diag(R}/,2, ..., Rrp2). 

Attention, pour le moment les 2 matrices sont semblables sur C. Maïs deux 
matrices réelles semblables sur C, le sont aussi sur R (?). 


?Rappelons la démonstration : si À et B de M,(R) sont semblables sur C, il existe une 
matrice inversible P à priori à coefficients complexes telle que AP = PB. Cette matrice P 
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e Réciproquement, si n pair et P € GL,(R), R = P diag(Rry2, .…, Rx) P7* 
vérifie bien À? = —1,. 
Faisons le bilan : 
- Si n est impair, Rac(—J,) est vide. 
- Sin est pair, Rac(—I,) = {Pdiag(R,p2,..., Rip) P À, P € GL(R)} 
et l’on obtient une seule classe de similitude. 


5. Soit À une racine carrée de la matrice À diagonalisable. L'idée est de se 

ramener aux Cas précédents par diagonalisation simultanée possible grâce à la 
commutation. 
Notons À1,...,AÀ4 les valeurs propres de À et p1,...,px leur multiplicité res- 
pective. Notons u et v les endomorphismes de R” canoniquement associés à À 
et R. Puisque u et v commutent, v laisse stable les sous-espaces propres de u. 
Ainsi dans une base de vecteurs propres de u (elle existe puisque w diagona- 
lisable), la matrice de u est diagonale et celle de v est diagonale par blocs. 
Voici la traduction matricielle : si P désigne la matrice de passage de la base 
canonique de R’ à la base de vecteurs propres, on a 


A = Pdisg(l1l,..., 80) P7T et R= Pdiag(R1,.…., Rk) PT 


avec R; € M,,(K). 
Comme A = R?, par produit des blocs, on tire que pour tout à € {1,...,k} 
Xilpi = R;?. Les matrices R; sont donc des racines carrées des matrices Xp, 


- Si À; = 0, on est ramené à Rac0 


R; \° 
- Si À; > 0, on est ramené à RacL,, car 1, = [7 |. 
| ‘ (7) 


: su Ro N° 
Si À; < 0, on est ramené à Rac(—J,,) car —1,, = (2) 

6. Si on pose z = a +ib = reŸ, A représente dans la base canonique la 
matrice de la similitude directe de rapport r et d’angle 4 : À = rRg avec 
ne Le — sin 0 | 

simf cos 
On trouve alors immédiatement que les deux similitudes de rapport +\/r et 
d'angle 0/2 fourniront deux racines carrées de À : 


R1 = VTRo et Ro — —VTRop2. 


s'écrit P = P.+iP2 avec Pi et P2 dans M, (R). Puisque À et B sont réelles, par identification 
des parties réelles et imaginaires, on a AP; = PB et AP2 = PB. 

L'application polynomiale & : t + det(P1 +tP2) de C dans C est non nulle car @(i) # 0 
donc admet un nombre fini de racines. En particulier, elle ne s’annule pas sur R tout entier, 
d’où l’existence d’un réel a tel que la matrice Q = P1 + aP soit dans GL,(R). On conclut 
alors facilement que À = QBQ !. 
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Reste à vérifier que ce sont les seules. 

Il est facile de vérifier que À admet pour valeurs propres z et z. Comme b # 0, 
cela fournit 2 valeurs propres distinctes. À est donc diagonalisable et à spectre 
simple sur C. D’après la question 1, on obtient donc 4 racines carrées complexes 
de À semblables à : 


diag(e1 re? core? ) avec €1,€2 € {+1}. 


Reste à chercher lesquelles sont réelles parmi les 4. Si 1 Æ €, les valeurs 
propres de la racine carrée ne sont plus conjuguées car de la forme s et —5 
avec s Z£ 0, ce qui est impossible pour une matrice réelle. 

A admet donc au maximum 2 racines carrées réelles, mais comme on a déjà 
vu que R1 et R2 conviennent, ce sont les seules. En conclusion : 


Rac (r Ro) . {EVrRop}. 


7.(a) Rac À est un ensemble algébrique, c’est-à-dire une intersection de zéros 
de fonctions polynomiales non nulles. À ce titre, il est fermé et d'intérieur vide 
(c’est une petite partie au sens topologique de Baire). 

Ce résultat est très utile, une preuve détaillée figure dans l'épreuve d’algèbre 
du concours CCP section MP de 2005. Donnons néanmoins les grandes lignes 
de la preuve. Un ensemble algébrique est fermé comme intersections de fermés 
(qui sont des images réciproques du fermé {0} par une application continue). 
Un ensemble de zéros d’une fonction polynomiale P non nulle est d’intérieur 
vide. En effet s’il admet un point intérieur, P s’annule sur une boule ouverte qui 
est égale (en choisissant la norme infinie) à un produit cartésien d’intervalles 
ouverts, ce qui implique alors que le polynôme est nul. On conclut ensuite 
puisqu’une intersection de parties d'intérieur vide est encore d'intérieur vide. 


7.(b) Montrons que pour n > 2, Rac 1, n’est pas borné. On choisit la norme 
infinie sur M,(R), qui vaut le max des valeurs absolues des coefficients. Pour 


tout entier p non nul, 
À # 
Ta 


est une racine carrée de D, de norme égale à p. 
Sin > 2, la matrice diag(R,, 1,...,1) est encore une racine carrée de J, de 
norme p, ce qui prouve que pour n > 2, Rac 1, n’est pas borné. 


7.(c) Soit n > 2. Remarquons déjà qu’il n’existe pas de norme surmultipli- 
cative sur MA(R), car il y a des diviseurs de zéros : si A et B sont non nulles 
et telles que AB = 0, on a ||A||||B|| < [[AB]| = 0, donc ||A||||[B]|| = 0 donc 
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À = 0 ou B = 0 qui est faux*. 

Supposons qu’il existe || || surmultiplicative sur GL,(R) (où il n’existe plus 
de diviseurs de zéros). Soit À une matrice de Rac1,. Elle est inversible car 
det R = +1. On a alors 


ll = TRI ZTIRIÉ 


et donc ||R|| < ,/[[Z,|, ce qui est absurde puisque Rac 7, n’est pas borné 
(on utilise le fait que, dans un espace vectoriel de dimension finie, toutes les 
normes sont équivalentes). 


7.7.3  Raffinement de la surjectivité de l’exponentielle 


Exercice 7.3 Cet exercice propose une jolie preuve topologique du lemme 7.2 : 
pour toute matrice À de M,(C), il existe un polynôme P de C[X] tel que 
À = exp(P(A)). 
1. En dimension 1 : 
(a) Montrer que H = exp(C) est un sous-groupe ouvert de C*. 
(b) Montrer que H est aussi fermé dans C*, conclure que exp : € — C* 
est surjective. 


2. En dimension quelconque : Soit A € M;(C). On veut montrer qu'il existe 

P € C[X] tel que À = exp (P(A)). 

(a) L'application exp est-elle un morphisme de groupe additif M,(C) sur 
le groupe multiplicatif GL,(C) ? 

(b) On note C[AÏ* = C[A] N GL,(C). Justifier que exp : C[A] — C[A}* 
est bien définie et que C[A]* est un ouvert de C[A]. 

(c) Montrer que exp est de classe CT sur M,(C). 

(d) Montrer que H = exp(C{[A]) est un sous-groupe ouvert de CA] 
puis conclure. 


* 
1 


Commentaires : nous reprenons ici la jolie preuve de Pommelet [Po] de la 
surjectivité de exp de € sur C*. Si on essaye de la généraliser à GL,(C), ce qui 
bloque c’est le défaut de commutativité, pour pallier à ce problème, l’idée est 
de restreindre la source à un ensemble de matrices qui commutent, on choisit 
alors naturellement C[A]. 


Cette remarque aboutit en fait à une autre preuve : supposons donc qu’il existe une 
norme surmultiplicative sur GLA(R). Soit À une matrice inversible fixée et B une matrice 
non nulle telle que AB = 0. Par densité de GLA(R) dans MA(R), il existe une suite de 
matrices inversibles (Bz) qui converge vers B. 

Pour tout entier naturel k, on a [[A||||Bx||—-||ABz|| < 0, d’où par passage à la limite (licite 
puisque l'application M + ||[A||||M|| — [| AM|| est continue), on a |[A|||[B|| < || AB|| = 0 
d’où |[A||||B|| = 0, et donc À = 0 ou B = 0, ce qui est faux. 
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Cet exercice utilise le théorème d’inversion locale, et une technique de connexité 
dans les groupes topologiques!. Plus précisément, on verra que si H, sous- 
groupe d’un groupe topologique G, admet un point intérieur, alors H est 
ouvert dans G mais il est alors aussi fermé dans G, donc si G est connexe... 


Corrigé : 1.(a) Pour tout a, b € C, exp(a + b) = exp(a)exp(b). La fonction 
exp : € — C* est donc un morphisme de groupes, par suite exp(C) est un 
sous-groupe de C*. 

Montrons que 1 est intérieur à H. La fonction exp est holomorphe de dérivée 
elle même, elle est donc de classe C1 si on la regarde comme une fonction de 
deux variables réelles, sa différentielle en 0 est la multiplication par exp(0) = 1, 
c’est donc l'identité sur R?. D’après le théorème d’inversion locale, exp est 
donc localement inversible, il existe un voisinage ouvert V de 1 dont tous les 
éléments sont des exponentielles, donc 1 € V € H, ce qui montre que 1 est 
intérieur à H. 

Si a € H,, aV est un voisinage de a, ouvert puisque image de V par l’homéomor- 
phisme À ++ ah (sa réciproque est À ++ a-Th), et inclus dans H car H est stable 
par multiplication. H est donc ouvert. 


1.(b) On partitionne G en ses classes modulo H (x + y & xy ! € H). 
Chacune de ses classes bH est ouverte comme image de l’ouvert H par h + bh. 
Le complémentaire de H dans C* est donc la réunion des ouverts bA avec 
b € H, c’est donc une partie ouverte de C*, ce qui donne A fermé dans C*. 
Concluons : À est à la fois fermé et ouvert dans C*, qui est connexe, et H 
n'est pas vide, donc H = C*. 


2.(a) Dès que n > 2, comme deux matrices ne commutent pas forcément, on 
n’a plus exp(A + B) = exp(A) exp(B), l'application exp : M,A(C) — GL,(C) 
n’est donc plus un morphisme ! On ne peut donc pas généraliser ainsi la preuve. 
Il nous faut de la commutativité. On pense alors aux algèbres de polynômes.. 


2.(b) Si M = P(A) où P est un polynôme, 


exp(M) = lim S EQE 


n— +00 
k=0 


Comme C[A] est une C-algèbre de dimension finie” (C[A] est un sous-espace 


vectoriel de M,(C) de dimension finie sur C), c’est donc une partie fermée 
de M,(C). Par suite exp(M) est un polynôme en À, puisque limite d’une 


#Un groupe topologique est un groupe muni d’une topologie séparée pour laquelle la 
multiplication et l'inverse sont continues. Cette définition n’est pas utile pour l’exercice. 
En fait la dimension de C[A] vaut le degré de TA, polynôme minimal de A. 
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suite de polynômes en À. On sait en plus que exp(M) est inversible, donc 
exp : C[A] — C[AJ* est bien définie. 

On a C[A* = {M € CA], det M Z 0}, donc c’est une partie ouverte de C[A] 
comme image réciproque de l’ouvert C* par l’application continue det (car 
polynomiale). 


2.(c) Une méthode consiste à utiliser le théorème de dérivation terme à 
terme d’une série de fonctions. On pose pour k € N, 


MÂ 


Les fonctions f, sont de classe C1 sur M,(C) (car les coefficients de la matrice 
M/k! sont des polynômes en les coefficients de M), la série 5,59 fx converge 
simplement sur M,(C). Il suffit donc de prouver que montrer que la série 
Y_x>0 d fx converge uniformément sur les compacts de M,(C). 

Pour cela, on choisit sur M,(C) une norme || || sous-multiplicative, c’est-à-dire 
telle que || AB]|| < ||A||||B|. 

Il nous faut calculer pour tout entier k > 1, la différentielle de la fonction fx, 
donc de l'application M ++ MF. Pour la différentielle en X, on isole les termes 
linéaires en H obtenus en développant (X+H)". Les autres termes (en nombre 
fini) ont au moins deux fois le "facteur" H, ce sont donc des O(||[H||?). 


(X + H)° 


(X+H)...(X+H) 
XF LAMPE LR AAN 24e Xe OA). 


On en déduit pour k > 1 que la différentielle de f; en X, notée dfx, est 
l'application linéaire de M,(C) dans M,(C) définie par 


1 
dfx(X).H = AT RE A e  EN) 


On note £ l’espace vectoriel des applications linéaires de M,(C) dans M, (C), 
que l’on munit de la norme W subordonnée à || ||. Il s’agit de montrer que 
SL dfx converge uniformément sur les compacts de M,(C). Pour tout H ap- 
partenant à M,(C), on a 


1 _ 
Naf OAI < AA ITA, 


donc : 
LX1 15? 


NRC) < 
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La série D n>0 dfx est donc uniformément convergente sur les boules 
{X € M,(C), IX < R} 


de M,(C), la série D '}09 fx converge simplement vers exp, et l’on en déduit 
que exp est de classe C'! sur ces boules, donc sur M, (C). 


Remarques : a) Vous pouvez regarder Rouvière ([Ro|, exercice 38), pour 
une preuve du théorème de dérivation terme à terme des séries de fonctions. 


B) On peut montrer que exp est de classe C'®, on pourra consulter Lafon- 
taine ([Laf], p 36) pour une preuve différente à l’aide d'analyse complexe. 


7) Attention, on ne peut justifier que exp est de classe C! par l’argument 
exp À est un polynôme en À. En effet, les coefficients du polynôme dépendent 
de À... Avec ce même raisonnement, on comettrait l’erreur de dire que l’ap- 
plication qui à une matrice associe son polynôme minimal est continue... Ceci 


est faux, la suite 
ef 0 LR 
m=(0 7%) 


tend vers la matrice nulle. Pour tout n, le polynôme minimal de A, est X?, il 
ne peut donc tendre vers X le polynôme minimal de la matrice nulle. 


2.(d) À partir de là, il n’y a plus qu’à imiter la preuve de la question 1. 
Comme tous les polynômes en À, commutent entre eux, exp : C[A] — C[A}* 
est un morphisme de groupes, et H = exp(C[A]) est un sous-groupe de C[A]*. 
La fonction exp est de classe C!, sa différentielle en 0 est l'identité donc est 
inversible : 

exp(H) = 1, + H +O(||H|f?). 


On en déduit l’existence d’un voisinage ouvert V tel que /, € V € H. Pour 
tout M € H, MY est un voisinage ouvert de M dans H, car B+ MB est 
un homéomorphisme sur GLA(C) (c’est une application linéaire donc continue 
car en dimension finie), d’inverse B + M71B). 

Le groupe H est donc un sous-groupe ouvert de C[A}*, il est donc aussi fermé 
(même preuve qu’en 1.b). 

Si M et N sont dans C[A}*, la fonction polynomiale non nulle de € dans C 


zH det ((1—2)M +2N) 


n’admet qu’un nombre fini de zéros et ne s’annule ni en 0, ni en 1, donc il 
existe un chemin continue y joignant 0 à 1 qui évite ces zéros dans C. Alors 
l’arc paramétré 

te (1-76) M + JC)N 
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joint M et N et est à valeurs dans C[A}*, ce qui prouve que C[A[* est connexe 
par arcs. 

Finalement la partie H est non vide, ouverte et fermée dans le connexe C[A]*, 
donc H = C[A}*, ce qui achève la preuve. 


Remarque : GZ,(C) est un groupe topologique, sa topologie provient de 

l’espace vectoriel normé M,(C), et les applications (4, B) + AB et A+ Al 
: t : : : : 

sont continues (comme À! = cmt l’application inverse est une fraction 


rationnelle en les coefficients de À). 


7.7.4 Matrices toutes puissantes sur Z 


Exercice 7.4 Le but de cet exercice est de déterminer les matrices toutes 
puissantes sur Z, à savoir les matrices À de M, (Z) telles que pour tout k € N*, 
il existe une matrice B de M, (Z) telle que À = B*. 
Si p est un nombre premier, on note T la classe d’un entier x modulo p, et mp 
l’application de M,(Z) dans M, (Z/pZ) qui à une matrice M de coefficients 
(Mij) associe sa réduction modulo p, c'est-à-dire la matrice n,(M) dont les 
coefficients sont (M). 

1. Démontrer que si À € M,(Z) est toute puissante sur Z, alors pour tout 
nombre premier p, la matrice n,(M) est toute puissante sur Z/pZ. 


2. Démontrer que si une matrice M de M,(Z) est telle que pour tout nombre 
premier p, Tp(M) = 0, alors M est la matrice nulle. 


3. Démontrer que les matrices de M,(Z) toutes puissantes sur Z sont les 
matrices de projecteurs (on pourra utiliser la détermination des matrices toutes 
puissantes sur les corps finis). 


Commentaires : ce joli petit exercice est un exemple réussi de passage du local 
au global en arithmétique. On cherche tout d’abord des solutions modulo p (so- 
lutions "locales") puis on remonte aux solutions sur Z (solutions globales"). 
On peut citer pour la culture le principe de Hasse : sous certaines hypothèses, 
une équation polynomiale P(x) — 0 à des solutions dans Q si et seulement 
si elle en à dans tous les complétés de Q (au sens métrique du terme), et les 
seules complétions de Q sont R et les corps p-adiques Q, pour tout p premier. 


Corrigé : 1. Soit p un nombre premier. Soit M = (mi;) et N = (n;;) deux 
matrices de M,(Z). Puisque la surjection canonique 


Z — Z/pZ 


ZT PA 
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est un morphisme d’anneau, on à 
n nm 
Mij + Nij = Mij + Mij et ) MikTkj = ) Mk Tkj- 
k=1 k=1 


Ainsi 7)(M + N) = 7,(M) + m,(N) et r,(MN) = r,(M)rp(N) et donc 
l'application 

Ty: MufZ) — Mi(Z/p2) 

(mis) + (mx) 

est un morphisme d’anneaux. 
Soit À toute puissante sur Z. Pour tout k € N*, il existe une matrice B 
de M,(Z) telle que À = BF. Alors en réduisant modulo p, il vient par le 
morphisme Ty, Tp(A) = Ty(B)", ainsi r,(A) est toute puissante sur Z/pZ. 


2. Soit M = (mi;) dans M,(Z) telle que pour tout nombre premier p, 
#p(M) = 0. Alors les coefficients m;; sont des entiers divisible par tout nombre 
premier p, ce qui n’est possible que si m;; = 0, c’est-à-dire M — C. 


3. Soit À une matrice toute puissante sur Z. Alors d’après la question 1, 
pour tout nombre premier p, la matrice mr, (À) est toute puissante sur le corps 
fini Z/pZ. Mais on a démontré au théorème 7.5 que les matrices toutes puis- 
santes sur un corps fini sont les projecteurs. Aïnsi r,(A) est un projecteur 
et rp(A)? = m)(A). D'où par morphisme 7,(4? — A) = 0 et ceci pour tout 
nombre premier p. D’après la dernière question, cela implique que 4? — À = 0, 
et donc À est un projecteur. 

Réciproquement si À € M,(Z) est un projecteur, par récurrence immédiate 
pour tout 4 € N*, on a A = AF donc À est toute puissante sur Z. 
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